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ПРЕДИСЛОВИЕ 


ства, используемые в настоящее 
логиях идентификации личности человека, а также рассмотреть 


распознавания лиц, работающих в режимах «оЁ{-Ппе» и ‹оп-Нпе». 

Монография состоит из шести основных разделов. 

Первый раздел посвящен рассмотрению биометрических техно- 
логий и биометрических систем, их характеристик, а также тенден- 
ций на рынке продаж. Здесь же приведены адреса сайтов, на кото- 
рых можно найти дополнительную информацию о коммерческих 
биометрических продуктах и системах, а также фирмах — произво- 
дителях биометрических технологий. 

Второй раздел посвящен обзору методов и средств биометриче- 
ских технологий, использующих отпечатки пальцев, геометрию ру- 
ки, очертаний лиц и особенностей радужной оболочки глаза для 
идентификации личности. Здесь же дана оценка состояния и перс- 
пектив развития соответствующих направлений биометрических тех- 
нологий, в некоторых подразделах представлены и коммерческие 
системы — лидеры в своих направлениях. 

Третий раздел посвящен цифровой обработке изображений и 
тем методам, которые наиболее часто используются в биометриче- 
ских технологиях обработки исходной информации. Здесь охарак- 
теризованы формы и способы отображения цифровых изображе- 
ний, базовые процедуры обработки и наиболее часто используемые 
в задачах распознавания образов виды преобразований — Фурье, 
Фурье—Меллина и Карунена—Лоэва. Для каждого из представ- 
ленных методов обработки приведена соответствующая программа 

в языке пакета МАТГАВ. ; 

В четвертом разделе представлены методы предварительной 
обработки исходных данных для распознавания лиц. Раздел вклю- 
чает практические решения задачи автоматического выделения 
образа лица из исходных изображений (сцен), деталей лица, а так- 
же определение антропометрических параметров лиц. В разделе 
приведены методы и конкретные алгоритмы согласования разме- 
ров изображений лиц, а также процедуры нормализации изобра- 
жений лиц (элиминирование наклонов и поворотов головы, нор- 
мализация яркости исходных изображений). 














Пятый раздел посвящен методике построения (синтез 
лиз) систем распознавания лиц на основе использования баз дан. 
ных с лицами. Здесь рассмотрены: решение задачи разделения 
исходных данных на обучающую и контрольную группы, мето ди- 
ка отбора первичных признаков и способы их редукции, собствен. 
но процесс распознавания (сравнения с эталоном) и методика ВЫ- 
бора параметров системы распознавания. Раздел иллюстрирован 
практическими решениями и примерами. 

В шестом разделе поанализированы системы «оп-Ппе» распо- 
знавания лиц, которые работают в режиме реального времени с ви- 
деокамерой. Обсуждаются возможные варианты построения подоб- 
ных систем распознавания, их структура и способы повышения 
точности распознавания. Подробно обсуждаются два класса систем 


«оп-Ппе»: предназначенные для идентификации посетителей и кон. 


троля доступа. Раздел иллюстрирован примерами из практики реше- 


ния задач распознавания лиц в режиме «оп-Ппе». 


В заключение приведены изображения из тестовой базы лиц и 
словарь терминов по биометрике. 


Монография появилась в ходе подготовки курса лекций и лабо- 


раторных работ по биометрическим технологиям на факультете 
информатики Щецинского политехнического 


информатики, а также при реа- 
ого проекта для американской фирмы АТОЕС. 


р жку научных иссле- 
дований по распознаванию лиц. 


Наконец, автор считает своим приятным долгом поблагодарить 
сотрудников лаборатории «Обработки изображений и распознава- 
ния образов» П. Форчманского (Р. ЕогсатайзК1), М. Боравского 
(М. ВогамзЕ!), Е. Полролничка (Е. Ровойисгак), Т. Пониковского 
(Т. Ро комзК1), а также А. Туяку (А. Таака), Т. Брылку (Т. ВгуЖа) 
и многих своих студентов, чьи исследовательские работы и науч- 
ные дискуссии с которыми позволили получить положительные 
практические результаты, а также способствовали улучшению ме- 
тодики изложения материалов настоящей монографии. 

Фотопортреты лиц, которые использованы в монографии, при- 
надлежат в большинстве случаев сотрудникам факультета ин- 
форматики и лаборатории «Обработки изображений и распозна- 
вания образов» и публикуются с их разрешения. 


Отзывы о монографии можно присылать но электронному адре- 
су: веоге1.Кисвагеу@у1.рз.р1 
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1. ВВЕДЕНИЕ В БИОМЕТРИКУ 


В 1974 г. вышла в свет монография «Ра беги Весоги!Ноп 
Рите ез» («Принципы распознавания образов»)\, авторы которой 
Ту и Гонсалес отметили одну из нарождающихся тенденций тех 
лет: «...В нашем обществе создалось такое положение, при кото- 
ром все большее количество людей и организаций занимаются обра- 
боткой информации и все меньшее — обработкой материальных 
объектов. Ощутимой стала потребность в более совершенных ин- 
формационных системах...» [Тои74]. 

За прошедшие 26 лет эта тенденция интенсивно и экстенсивно 
развивалась, в результате чего человечество перешло от простых 
информационных систем к использованию интеллектуальных сред — 
вычислительных и информационных технологий современного по- 
коления [Пен00]. 

Примерами интеллектуальных сред являются [50197, Пен00]: 

— интернет, через который происходит, в частности, общение 
людей (видеоконференции, консультации, почта), поиск информа- 
ции и доступ к ней, реализуются интернет-маркетинг и интернет- 
магазины и т. д.; 

— виртуальные предприятия, реализующие проекты по типу 
«Збагф ир», сообщества и ассоциации, осуществляющие обмен ин- 
формацией, технологиями, другими информационными и вычис- 
лительными ресурсами; 

— высокоорганизованные интерфейсы систем «клиент—банк»; 

— системы класса «\У1зЦог 1Чеписайопт», реализующие рас- 
познавание или аутентификацию, например, постоянного покупа- 
теля магазина, гостя (посетителя) частного дома или офиса, пасса- 
жира международного транспорта и т. д; 

— системы контроля доступа к информации (базам данных), 
к средствам (техническим, финансовым), к помещениям, к ресур- 
сам (например, вычислительным); 

— системы поиска фотографий лиц людей в базах данных по 
заданному образцу (например, фотороботу). 

Для всех перечисленных примеров характерно одно: все задачи 
решаются в процессе непосредственного общения человека со сре- 
дой (в режиме «оп-Нпе») и, что самое важное, — этим человеком 
может быть только зарегистрированный пользователь, подлинность 
личности которого проверяется на входе в интеллектуальную сре- 
ду. Поэтому, очевидно, что одной из актуальных проблем широко- 
го использования интеллектуальных сред является проблема иден- 
тификации (аутентификации) конечного пользователя. 

На современном этапе развития интеллектуальных сред задачи 
идентификации (аутентификации) конечного пользователя реша- 
ются в рамках биометрических технологий [В1о**, Мат00, Пан00]. 





* В России ее перевод был опубликован в 1978 г. — Прим. авт. 








Так, например, в мае 2000 г. компания М!сгозо?& заявила 
о том, «что все будущие версии ОС У/тдо\з будут иметь 
ные средства поддержки биометрического интерфейса (В1отенте 
АррИсайоп Ргоргашиция Пуег{!асе — ВАР] и технологии автори. 
зации БесигебиЦе. Совместно с компанией 1/0 ЗоЁ5\уаге [В10** |, за. 
нимающей лидирующие позиции в области программных средств 
биометрики, М1сгозо# намеревается реализовать комплексный по д- 


ход к идентификации пользователей во всех своих последующих 
операционных системах...» 


Встроен. 


1.1. ВВОДНЫЕ ПОНЯТИЯ 


Представим несколько вводных понятий из области биомет- 
рики и биометрических технологий. 

Биометрика (В1отей1сз) — область знаний, представляющая 
методы измерения физических характеристик и формулирования 
персональных поведенческих черт человека и их использования 
для идентификации или аутентификации человека [Моо97]. 

Здесь следует отметить, что в отечественной научно-популяр- 
ной литературе вместо термина «биометрика» (это соответствует 
прямому переводу английского слова «Бошейсз») используется 
термин «биометрия», который, в свою очередь, появился как пере- 
вод слова «Ботефгу». Последний термин был введен в употребле- 
ние Френсисом Гальтоном в 1889 г. в книге, посвященной про- 
блемам природной наследственности. В дисциплину биометрии 


лирование в биологии, биологическо 
рования эксперимента и т. д. Разни 
ми выше терминами отчетл 
[Лит22, Бар90, Зав98, Лео99]. 

В настоящей книге будет применяты 
вытекающий из представлений [\УУоо97]. 

Собственно идентификация или аутенти 
ализуется биометрической системой. 
ческая система — автоматизированная система, решающая зада- 
чи регистрации пользователей и их идентификацию (аутентифи- 
кацию) и реализующая следующие функции: 

— фиксацию биометрической вы 
теля; 

— извлечение биометрических 

— сравнение биометрических 
количеством эталонов; 

— принятие решения о том, насколько хорошо соответствуют 
друг другу сравниваемые биометрические данные; 

— формирование результата, например, информации о том, была 
или нет достигнута идентификация или аутентичность; 


ца между двумя приведенны- 
иво прослеживается в публикациях 


ся термин биометрика, 


фикация человека ре- 
В свою очередь, Биометри- 


борки от конечного пользова- 


данных из этой выборки; 
данных с одним или большим 
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[Мат] 





— принятие решения о повторении, окончании или видоизме- 
нении процесса идентификации (или аутентификации). 

Методы и соответствующие им технические средства получения 
и использования биометрических данных человека в целях его иден- 
тификации (верификации, аутентификации или распознавания) оп- 
ределим как биометрические технологии. При этом в биометри- 
ческих технологиях используются как физические биометрические 
характеристики человека — отпечатки пальцев, геометрия руки, 
изображения радужной оболочки и сетчатки глаза, голос, видео- и 
термоизображение лица, подпись (а в последнее время изображения 
и форма ушей, запах человека), так и поведенческие биометрические 
характеристики, например, манера работы на клавиатуре компью- 
тера, динамика написания подписи, стиль и манера походки. 

Некоторые примеры статических характеристик представле- 
ны в табл. 1.1.1. На практике используются как графические 
особенности (см. табл. 1.1.1 среднюю колонку), так и специфиче- 


ские особенности биометрических характеристик (см. правую ко- 
лонку). 


Таблица 1.1.1 
Примеры статических характеристик 


Характеристика Пример Используемые особенности 


1. Форма лица (овал, форма и разме- 
ры отдельных деталей лица); 

2. Геометрические параметры лица — 
расстояния между его определенными 
точками. 

3. Узор подкожных кровеносных со- 
судов, получаемый как термограмма 
лица. 











Лицо 











1. Рисунок радужной оболочки. 
2. Узор кровеносных сосудов`насетчат- 
ке. 


Глаз 








1. Рисунок формы уха (контур и на- 
клон, козелок и противокозелок, фор- 
ма и прикрепление мочки и'т. д. 

2. Параметры, выраженные как рас- 
стояния между определенными точка- 
ми на ухе. 


Ухо 



























Продолжение табл. 1.1.1 
| 
| 


Используемые особенности 

















1. Геометрия руки (ширина, длина, 
высота пальцев, расстояния между оп- 
ределенными точками). 

2. Неровности складок кожи на сги- 
| бах пальцев тыльной стороны кисти 

% руки. 
| 3. Рисунок вен на тыльной стороне 
кисти руки, получаемый при инфра- 
красной подсветке. 
4. Узор на ладони. 


1. Папиллярный узор как целостный 
образ. 





Отпечаток 
пальца 













2. Параметры минуций (координаты, 
ориентация, тип). 











1. Подпись как двумерный бинарный 

образ. 

оо 2. Подпись как функция двух коор- 
динат. 


3. Динамика подписи (сила нажима 
и координата времени). 

















| Пример динамической (поведенческой) биометрической харак- 
| теристики — динамики подписи — приведен на рис. 1.1.1. 
Среди задач, которые можно решать с помощью биометрики, мож- 
но выделить, по крайней мере, три: идентификация (аутенти- 
фикация) личности человека; оценка намерений и наклонностей ин- 
дивидуума и медицинская диагностика состояния здоровья чело- 
| века; контроль доступа. Примеры приложений, в которых исполь- 
| зуется идентификация личности человека, приведены на рис. 1.1.2. 
| Оценка эмоционального состояния человека, его чувств и на- 
| мерений по отношению к окружающим важна в местах массово- 
го скопления людей. Идентифицировать эти состояния и намере- 
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НЫЙ 


ТЫ, 


р- 


иа 








ные НЕС 





Рис. 1.1.1. Пример поведенческих биометрических характерис- 

тик: а — динамические характеристики А(1) (колебания пера и 

время написания подписи), принадлежащие автору подписи; 

Ь — те же характеристики для случая, когда подпись повторяет 
другое лицо 


ния — значит предупредить возможные тяжелые последствия или 
непредвиденные ситуации. 

Каково предназначение человека, какими он «наделен» болез- 
нями или привычками, можно узнать по лицу человека (физиогно- 
мика), радужной оболочке глаза (иридоанализ, иридодиагности- 
ка), по почерку (графоанализ, графология) и голосу (рис. 1.1.3). 





ИДЕНТИФИКАЦИЯ ЛИЧНОСТИ ЧЕЛОВЕКА 
Криминалистика Идентификация конечного Паспортный 
и судебная экспертиза пользователя, клиента, гостя контроль 























Рис. 1.1.2. Примеры приложений идентификации (аутентификации) личности 
человека 
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ИДЕНТИФИКАЦИЯ НАМЕРЕНИЙ, НАКЛОННОСТЕЙ И СОСТОЯНИЯ 
ЗДОРОВЬЯ ЧЕЛОВЕКА 





Оценка Оценка характера Контроль на профпригодность Медицинская 
намерений по подписи диагностика 
те 
А 

















Рис. 1.1.3. Некоторые сферы приложений биометрики 


Контроль доступа к закрытым помещениям (научным лабо- 
раториям, складам, операционным залам и другим объектам), 
к личной собственности (домам, гаражам, средствам связи, лично- 
му оружию, индивидуальным средствам передвижения), к вы- 


числительным и информационным ресурсам, к банковски 
миналам, сейфам и хранилищам — е 
биометрики (рис. 1.1.4). 


При этом для интеллектуальных сред следующего поколения 
наиболее приемлемы технологии идентификации человека по го- 
лосу и по лицу [Реп00, Отс00]. Как отмечено в [Реп00], эти техно- 
логии «ненавязчивы (распознавание происходит на расстоянии, 
не задерживая и не отвлекая человека }, они, как правило, пассив- 
ны (не требуют специальных действий со стороны человека ), не 
ограничивают, пользователя в свободе перемещений и к тому же 
относительно недороги. Но самое важное, по-видимому, то, что 
люди обычно узнают друг друга по голосу и по лицам довольно 
просто и, значит, не будут испытывать неудобств с подобными 
системами...» 

Некоторым из этих проблем, в частности идентификации (ве- 
рификации, аутентификации или распознаванию) человека на ос- 
нове лица, и посвящена настоящая монография. 


м тер- 
ще одна сфера приложений 








КОНТРОЛЬ ДОСТУПА 
К закрытым К собственности К вычислительным К банковским 
помещениям и средствам и информационным ресурсам операциям 
передвижения 


_ ТОР ЗЕСВЕТ 

















Приложения биометрики, связанные с контролем доступа 




















1.2. БИОМЕТРИЧЕСКИЕ ХАРАКТЕРИСТИКИ 
И ИХ СВОЙСТВА 


Биометрической характеристикой человека (БХЧ ) называет- 
ся его измеряемая физическая характеристика или персональная 
поведенческая черта. Идентификация человека — обладателя этой 
характеристики — реализуется в процессе проверки БХЧ на иден- 
тичность аналогичной характеристики зарегистрированному (санк- 
ционированному) пользователю. 

На рис.1.2.1 представлены наиболее часто используемые ис- 
точники биометрических данных, по которым определяются ин- 
дивидуальные биометрические характеристики человека. 

Свойства биометрических характеристик. Идеальная БХЧ долж- 
на быть универсальной, уникальной, отличаться постоянством и 
«собираемостью» [+а100]. 

Универсальность означает, что каждый человек может быть пред- 
ставлен этой характеристикой. Уникальность означает, что не мо- 
жет быть двух человек, имеющих идентичные характеристики. 








ГОЛОС 















УШИ 
Изображение 





ОТПЕЧАТКИ 
ГУБ 
















БИОМЕТРИЧЕСКИЕ 









































ЛИЦО ХАРАКТЕРИСТИКИ ГЛАЗА 
Видеообраз Радужка 
Термообраз Сетчатка 

РУКА ПАЛЬЦЫ 
Геометрия Узоры отпечатков 
Образ ладони Отпечатки 

















ПОДПИСЬ 
и динамика ее 
воспроизведения 








Динамика работы 
на клавиатуре 
компьютера 














ПОХОДКА 














Рис. 1.2.1. Источники физических и поведенческих биомет- 
рических характеристик 
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Постоянство определяет независимость характеристики во време. 
ни, а собираемость — то, что характеристика может быть относи. 
тельно просто и быстро получена от каждого индивидуума и так 
же может быть относительно просто и быстро детализирована. 
Однако, как свидетельствует практика, реальные БХЧ не столь 
идеальны, что может существенно ограничивать их применение. 
В табл. 1.2.1 приведена экспертная оценка (в основном по матери- 
алам [+а100]) свойств некоторых биометрических характеристик. 
Как видно из табл. 1.2.1, ни одна из характеристик не имеет 
высоких оценок по всем параметрам, хотя, стоит заметить, выбор 
конкретной БХЧ определяется не столько этими оценками, сколь- 
ко условиями применения систем идентификации — их назначе- 
нием, степенью ответственности при принятии решений, степенью 
защиты от несанкционированного доступа к системе (степенью за- 
щиты от взлома системы) и, наконец, стоимостью самой системы. 
Точность и стоимость биометрических систем. Примерные 
соотношения различных биометрических технологий по затра- 
там на их реализацию и по достижимой с их использованием 
точности идентификации людей представлены схематически на 
рис. 1.2.2 [Пан00]. 
Затраты здесь складываются из затрат на закупку сканеров 
(датчиков) биометрической информации, разработку и реализа- 
цию собственно биометрической системы (проект + компьютер- 


Таблица 1.2.1 
Экспертная оценка свойств БХЧ 


Уникальность | Постоянство 


+ ++ 


Отпечаток пальца ++ 
Геометрия руки ре ЗЕ | 
глаз 

Гони ГЫ а 

К ЕН БЕН Ис. | 


Особенности ушной НЕЕ 
раковины 


















Характеристика Универсальность 





Собираемость 
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еров 
1иЗа- 











ная система + математическое обеспечение + техническое обслу- 
живание), а также затрат на ее эксплуатацию. 

Как следует из рис. 1.2.2, очевидны две противоречивые тен- 
денции: первая (отмечена наклонной стрелкой в направлении: 
голос —> лицо > палец > сетчатка > радужная оболочка) как 
бы свидетельствует о том, что точность биометрических техноло- 
гии прямо связана с затратами на их реализацию. Вторая (про- 
слеживается в направлении: палец — подпись (уши) — рука) 
говорит о том, что дорогие технологии не всегда самые точные 
[Пан00]. Так от чего же зависит выбор той или иной биометри- 
ческой технологии для конкретных приложений? 

Обратим внимание на технологию, использующую отпечатки 
пальцев. На рис. 1.2.2 эта технология оценена как имеющая сред- 
ний показатель затраты/точность. Однако по оценке междуна- 
родной группы по биометрике (1 4егпа&опа! В1отей1с @тоир — 
ВТС, [В10**]) данная технология была в 1999 г. лидером продаж 
среди прочих и занимала около 40 % рынка биометрических тех- 
нологий. 

Общая картина продаж средств биометрических технологий 
(по данным ВГС) представлена в табл. 1.2.2. 

Лидерство технологии, использующей отпечатки пальцев, на рын- 
ке продаж объясняется следующим. Во-первых, сказывается опыт 
длительного (исторического) применения отпечатков пальцев в кри- 
миналистике и связанное с этим утверждение международных стан- 
дартов на отпечатки пальцев (+ базы отпечатков), во-вторых, наличие 
широкой номенклатуры разработанных и внедренных в исполь- 
зование сканеров отпечатков пальцев, в-третьих, развитая система 
сканеров, встроенных в компьютерное оборудование (в мыши, кла- 
виатуру, ноутбуки), в-четвертых, существование готовых к приме- 



























































Затраты 
А 

Отпечатки Радужная 

Рука х губ оболочка 
т. м 
Уши а 
Подпись в Сетчатка” 
Палец 27” 
Лицо Е 
Голос 1” 
=== 
Точность 











Рис. 1.2.2. Затраты и точность различных биометрических 
технологий [Пан00] 
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Таблица 1.2.2 
Продажа средетв биометрических технологий в 1999 году 









Средства биометрических технологий 






Объем продаж, % 
Терминалы и устройства идентификации по отпечаткам пальцев 
Устройства распознавания по геометрии руки 


Системы распознавания по лицам 


15 
Сканеры и системы идентификации по радужной оболочке глаза 9 
Сканеры и системы идентификации по сетчатке глаза 2 
Системы идентификации по голосу и 


Системы верификации по подписи 





нению законченных устройств и терминалов идентификации отпе- 
чатков, которые продаются в комп 


лекте с системами АЕП, и, нако- 
нец, в-пятых, наличие подробно описанных и проверенных практи- 
кой алгоритмов идентификации отпечатков пальцев. 

Представим теперь оценки биометрических технологий и ос- 
нованных на них систем с точки зрения пользователей этих си- 
стем [В1о**]. При этом отметим такие характеристики, как: 

® возможность решения задачи идентификации (а не аутенти- 
фикации); 


® сложность реализации систем идентификации; 
® достигаемую при этом точность идентификации; 


Таблица 1.2.3 
й 


Оценки четырех биометрических технологи: 











Технология 
Характеристика систем ЕЕ: 
пальцев 
Возможность реализации + 
идентификации 

Точность систем Средняя | Средняя Высокая 
Сложность систем Средняя Низкая Средняя* 
Возможность обмана Средняя | Высокая Средняя* 


Бесконтактное получение Нет Нет Да 
данных 


Использование отличитель- Да Нет 
ных признаков 





Размер файла данных (байты) 90 9 


10 + 1000** 


Дружественность по отно- И ЕЕ ЕЕ 
шению к пользователю 





* — в зависимости от назначения системы; 
** — в зависимости от назначения системы, 
данных. 





объема базы данных и способа редукции исходных 
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В Таблица 1.2.4 
Адреса сайтов, посвященных биометрике 





Технология Адрес страниц 





Отпечаток пальца уу Мотейчсассезв.сот, уулу 1депх сот 

уум .Мотейче1А сот, уу\м/.ао.сот, ум. га-]епа.де, 
у\\.Ч1ЕЦа]регвопа. сот, уму\.зба тек. сот. $, 

угму 1030 таге.сот, ууу. 14епсафог. сот. 


Геометрия руки У\ У .гесорзуз. сот 


Лицо (видеообраз) уму асе. сот, уум.птгоз.сот, уу’\.пеигодупат!с:.сот, 


у\\.УПзаве.сот. 





Радужная оболочка уму. И1зсап.сот, умуу.зепзаг.сот. 











® степень возможности обмана системы (несанкционированно- 
го доступа); 

® возможность бесконтактного получения биометрических дан- 
ных; 

® размер файла эталона биометрической характеристики; 

® дружественность по отношению к пользователю. 

Эти оценки для четырех наиболее популярных биометриче- 
ских технологий сведены в табл. 1.2.3. 

Как видно из табл. 1.2.3, две последние технологии могут вы- 
звать повышенный интерес для практических приложений био- 
метрики. 

Новости о биометрике и ее приложениях, а также 4ето- 
версии систем распознавания биометрических образов (напри- 
мер, УеЕштеег, ТгиаеЕасе и др.), можно найти на ряде сайтов 
(табл. 1.2.4). 


2Г. А. Кухарев 

















2. ОБЗОР НЕКОТОРЫХ БИОМЕТРИЧЕСКИХ 
ТЕХНОЛОГИЙ 


2.1. ТЕХНОЛОГИЯ ОТПЕЧАТКОВ ПАЛЬЦЕВ. 
ИСТОРИЯ ПРИМЕНЕНИЯ 


В качестве одного из аргументов применения технологии на 
основе отпечатков пальцев по сравнению, например, с технологией 
распознавания человека на основе его лица авторы [+а!97з], извест- 
ные своими работами в области АЕ[$, приводят фотографии, на ко- 
торых представлено несколько сцен в уличном кафе. Все персоны 
на фотографиях — официант, посетитель кафе, прохожий, ролико- 
бежец и т.д. — представляют как бы разных людей (они имеют 
разные прически и камуфляж — повязки и шапочки на голове, 
очки, усы...), и система Еасе ВесортНоп приняла бы их всех за 
разных людей. Однако все персоны на фотографиях — один и тот 
же человек! Очевидно, отмечают авторы работы [а197а], что с отпе- 
чатками пальцев невозможно сделать ничего подобного. 

Отпечатки пальцев для распознавания личности применялись 
уже в Древнем Египте, Ассирии, Китае и Японии [Поо98]. В этих 
странах для удостоверения личности в момент заключения различ- 
ных сделок, использовали отпечаток большого пальца. К пионе- 
рам дактилоскопии в ХХ в. можно отнести профессора Я.-9. Пур- 
кинье, врача Генри Фолдса, писателя Марка Твена, антрополога 
Френсиса Гальтона [Поо98]. 

Первый научный трактат о папиллярных узорах на пальцах на- 
писал в 1823 г. профессор Бреславльского университета Я.-Э. Пур- 
кинье. Он выделил и описал узоры (рис. 2.1.1), которые использу- 
ются в дактилоскопии до настоящего времени. 

Врач Генри Фолдс в 1824 г. представил чернильный отпечаток 
пальца как средство идентификации человека. Он же первым 
использовал отпечаток пальца в практике идентификации пре- 
ступника (отпечатки пальцев преступник оставил на бутылке из- 
под алкогольного напитка). 

Марк Твен в 1883 г. написал книгу «Жизнь на Миссисипи», 
в которой убийца был идентифицирован на основе собственного 
отпечатка пальца. В позднейших своих изданиях Марк Твен так- 
же описывал процессы поиска преступников с помощью отпечат- 
ков пальцев. 

Английский антрополог Френсис Гальтон в 1892 г. публикует 
книгу, в которой обращает внимание на уникальность характери- 
стик отпечатков пальцев каждого человека и их постоянство во 
времени. Он также представил первую систему признаков, по ко- 
торой можно классифицировать отпечатки пальцев. 

Главное, что вытекает из публикаций Ф. Гальтона и других 
пионеров дактилоскопии: в основе метода идентификации лич- 
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Рис. 2.1.1. Некоторые типы папиллярных узоров на пальцах: 


1-4 — узоры типа «петля» (соответственно левая, правая, центральная, двойная), 
5 иб — узоры типа «дельты» или дуги (соответственно простая и острая), аТ и 
8 — узоры типа «спираль» (соответственно центральная и смешанная) 


ности человека на основе отпечатков пальцев лежит факт их 
уникальности. Отпечатки пальцев, принадлежащие разным лю- 
дям, не могут быть идентичными. 

В ХХ в. этот метод получил официальное признание как науч- 
ный на Международном полицейском конгрессе (Монако, 1914 г.). 

В советской России начала ХХ в. дактилоскопической регистра- 
цией занимался П. С. Семеновский — первый заведующий кабине- 
том судебной экспертизы и регистрационным бюро Центророзыска. 


2.1.1. ИНФОРМАЦИОННЫЕ ПРИЗНАКИ ОТПЕЧАТКОВ ПАЛЬЦЕВ 


В каждом отпечатке пальца можно определить признаки двух 
типов, используемые при их идентификации: глобальные и ло- 
кальные [Ва&96, Сар99]. 

К первому типу относятся признаки, которые можно разгля- 
деть и/или различить на отпечатках пальцев невооруженным гла- 
зом: папиллярные узоры; область образа; ядро; пункты «дельта»; 
тип папиллярных линий и их число. 

Глобальные признаки интерпретируются следующим образом: 

® узоры папиллярные, о них мы вспоминали в разд. 1.2; 

® область образа — некоторый выделенный фрагмент отне- 
чатка, в котором локализованы все признаки; 

® ядро — пункт, локализованный в середине отпечатка или в ка- 
кой-либо выделенной области; 
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Рис. 2.1.2. Примеры микроузоров на основе двух типов минуций 


® пункт «дельта» — начальная точка, то место, в котором про- 
исходит разделение бороздки папиллярной линии или место, в ко- 
тором соединяются две бороздки, или, наконец, очень короткая (до- 
ходящая до точки) бороздка; 

® тип линии — две наибольшие линии, которые начинаются 
как параллельные, а затем расходятся и огибают всю область об- 
раза; 

® счетчик линий — число линий (бороздок) на области образа 
или между ядром и пунктом дельта. 

Ко второму типу относятся локальные признаки, называемые 
минуциями: это уникальные для каждого отпечатка признаки, 
определяющие пункты изменения структуры папиллярных линий 
(например, разрыв, окончание, раздвоение ит. д.), ориентацию па- 
пиллярных линий и координаты Х и Ув этих пунктах. Каждый 
отпечаток может быть представлен 50-70 минуциями. Фирма Ор{е! 
[В1о**] предоставила снимок различных микроузоров, которые 
могут образовываться из двух типов минуций — окончания и 
раздвоения гребней папиллярных линий (рис. 2.1.2). 

Практика показывает, что в отпечатках пальцев разных людей 
могут встречаться идентичные глобальные признаки, однако со- 
вершенно невозможно наличие в этих же отпечатках одинаковых 
микроузоров минуций. Поэтому глобальные признаки использу- 
ют при классификации (разделении на части) очень больших баз 
отпечатков пальцев и в иерархических процедурах идентификации 
отпечатков на этапах их предварительной классификации [Каё96, 
Сар99]. В последующем, на втором этапе распознавания отпечат- 
ка пальца, используют уже его локальные признаки. 

В процедурах аутентификации глобальные признаки могут быть 
достаточными для точного сравнения двух отпечатков пальцев. 


2.1.2. СТАНДАРТЫ НА ОТПЕЧАТКИ ПАЛЬЦЕВ 


К концу 70-х гг. ХХ в. вархивах федеральных служб США нахо- 
дилось более 200 млн отпечатков пальцев, а в специальные отделы 
ФБР ежедневно приходило до 30 тыс. запросов на их идентифика- 
цию [Тои74]. Оценить сегодня суммарный объем баз данных отпе- 
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\ чатков пальцев не представляется возможным — их число прибли- 


чн жается, скорее всего, к числу взрослых людей на земном шаре. 

Хх Создание и пополнение баз данных, идентификация отпечат- 
“ ков пальцев в национальных и транснациональных масштабах и 
Хх связанное с этим выполнение операций с данными, полученными 
< разными способами, использование различных систем идентифи- 
в кации (Алфотафеа Етбегргии% 1аепи сай оп Бузбетз, или АЕ[$) — 


все это потребовало установления стандартов на исходные отпе- 

чатки пальцев. 

и, На сегодняшний день в основном используются стандарты АМЗТ 

“№ и ФБР США [Аште**, В1о**, Е!100], в которых определены некото- 

№0. рые параметры изображений отпечатков пальцев, имеющие прин- 

и ципиальное значение в стандартизации построения баз данных и 
процедур проверки качества распознавания отпечатков, в том числе 





Нате: способы получения отпечатков, их представления в форме изобра- 
аСтЬ (6. жений, качество их как цифровых изображений — разрешение 

(или размер изображения отпечатка), число уровней представле- 
Обри ния яркости изображения, максимальные значения границ пара- 


метров искажений, например, поворота и т. д. Этими же стандар- 
тами определяются основные типы минуций. 

В целом стандартами установлены следующие требования к 
образу отпечатка: 








Х ЛИН ® каждый образ отпечатка представляется в формате ТТЕ в не- 
(ИК А: скомпрессованном виде; 
{аждый ® образ должен иметь разрешение не менее 500 ар:; 
ие бр ® образ должен быть полутоновым с 256 уровнями яркости; 
‘оторые ® максимальный угол поворота образа от вертикали + 15°; 

И ® основные типы минуций — окончание и раздвоение (стан- 


дарт ФБР США). 

Для ряда случаев стандарты устанавливают число образов, сня- 
тых с одного пальца и составляющих отдельный класс базы отнпе- 
чатков пальцев. В результате некоторые базы содержат до 10 от- 
зов печатков с каждого пальца. Например, база фирмы В1отей1с 

у Зузешт ГаЬ [Е11100] в одном классе содержит по восемь отпечатков 
одного и того же пальца; четыре отпечатка одного и того же пальца 
приведены на рис. 2.1.3. В исходной базе размер каждого образа 
составляет 256 х 256 пикселей. 




















6 Висит: а: Изображения отпечатков одного и того же пальца, составляющих один 
ий р класс 
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Наличие в базе данных нескольких отпечатков одного и того 
же пальца призвано улучшить качество распознавания в режи- 
мах «оп-Нпе», поскольку вся совокупность образов в классе ‹ох- 
ватывает» несколько различных вариантов изменении характе- 
ристик отпечатка. 

На рис. 2.1.3 видно, что образы отличаются друг от друга сдви- 
гом (перемещением центра отпечатка вверх и вправо) и неболь- 
шим, но заметным поворотом образов влево и вправо. Масштаб 
всей совокупности представленных выше образов оставался прак- 
тически неизменным, поскольку, очевидно, все они были получе- 
ны с одного и того же устройства сканирования отпечатков. 

Если оценивать подобие представленных отпечатков как бы 


«сверху», то можно утверждать, что все они действительно полу- 
чены с одного пальца. 


2.1.3. УСТРОЙСТВА ДЛЯ ПОЛУЧЕНИЯ 
ОТПЕЧАТКОВ ПАЛЬЦЕВ 


Выше отмечалось наличие широкой номенклатуры сканеров 
для получения отпечатков пальцев, в том числе встроенных в 
компьютерное оборудование (в мыши, клавиатуру, ноутбуки), а так- 
же готовых к применению законченных устройств и терминалов 
идентификации отпечатков, которые продаются в комплекте с си- 
стемами АЕ[$. 

Ниже представим некоторые из этих устройств, 
на которые можно найти в [Мат00, Отс00, В1о**, Е1100], а также на 
сайтах фирм — производителей этих устройств. Адреса сайтов были 
приведены в табл. 1.2.4 в первом разделе. 

Прежде всего отметим, что независимо от устройства, с помощью 
которого получен отпечаток пальца (емкостной датчик, элемент, чув- 
ствительный к температуре папиллярных линий, или оптический 
сканер), сам процесс их получения выглядит не сложнее, чем пред- 
ставлено на рис. 2.1.4. } 
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Рис. 2.1.4. Датчик, его крепление на мониторе и снятие отпечатка пальца 
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Заметим, что все отдель- 
ные устройства, подключае- 
мые к компьютерам, имеют 
0 $В-интерфейс. Датчик фир- 
мы СОМРАС, представлен- 
ный на рис. 2.1.4, и устрой- 
ство ЕСЗмеер02, показанное 
на рис. 2.1.5, имеют именно 
такие интерфейсы, что де- 
лает их универсальными и 
простыми в эксплуатации 
[Мат00, Отс00, В1о**, 1100]. 

Компанией «ВзотЕ — Рис. 2.1.5. Устройство считывания отпечат- 
ТесЪпо!021ез Гпфегпа1опа1, ков пальца ЕСууеер02 
пс.» разработана мышь 
-МабЬтм Вок Мочзе, предназначенная для использования в сис- 
темах контроля доступа конечного пользователя к персональному 
компьютеру или сети компьютеров [см. мебтазег@БоНтКиза.сот]. 

Достоинство применения такой мыши состоит в том, что пользо- 
ватель автоматически верифицируется при каждом подходе к ис- 
пользованию компьютера, а также может быть (незаметно для 
него самого) подвергнут дополнительной верификации в процес- 
се использования компьютера. Внешний вид стандартной компь- 
ютерной мыши, содержащей встроенный оптический сканер от- 
тиска большого пальца, представлен на рис. 21.6; 

Применение этой мыши для идентификации конечного нользо- 
вателя обеспечивает 100%-ную аутентификацию в локальной 
сетевой или межсетевой среде через В1оАпК-технологию. Наибо- 
лее важно то, что собственно отпечаток пальца пользователя ни- 
когда не сохраняется. Взамен этого мышь -Мафебтм Во ШиК со- 
здает 500-байтовый зашифрованный эталон, который не может 
быть реконструирован в отпечаток пальца пользователя. Тем са- 
мым обеспечивается дополнительная защита от угрозы обмана 
системы идентификации или специфического несанкционирован- 
ного доступа к ней. 

Компания «В1оиК 
ТесЬпоог1ез п\егпа& опа], 
Т1с.» отмечает следую- 
щие достоинства своих 
систем идентификации 
конечного пользователя: 

® размер сканируемо- 
го образа пальца: 284 х 
х 400 пикселей; 

® время регистрации 
Рис. 2.1.6. Мышь О-Мафёсвтм Вок Моизе со 0,13 с; 


встроенным устройством сканирования оттис- ® размер эталона отпе- 
ка пальца чатка пальца 500 байтов. 
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Рис. 2.1.7. Клавиатура со встроенным датчиком — сканером от- 
печатка пальца 


Фирма «Кеуфгоп1с» предлагает своим клиентам клавиатуру 
со встроенным датчиком — сканером отпечатка пальца. Внеш- 


ний вид такой клавиатуры показан на рис. 2.1.7 [Мат00, Отс00, 
В1о**, Е1100]. 





На современном этапе развития биометрических технологий 
некоторыми фирмами созданы и предлагаются на рынке целые 
системы контроля доступа пользователей к интеллектуальным 
средам. Такие системы включают весь состав компьютерного обо- 
рудования вместе с датчиками и оснащены как сканерами отпе- 
чатков пальцев прямого доступа пользователя, так и сканерами 

для мобильных пользователей (на базе смарт-карт). Внешний вид 
| системы В1оГодоп 2.0 показан на рис. 2.1.8. Система предназна- 














Рис. 2.1.8. Система аутентификации клиентов интеллекту- 
альных сред по отпечаткам: ы 

1 — сервер; 2 — шина интернет; 3 — датчик прямого действия; 
4 — датчик для смарт-карты; 5 — место пользователя (клиента); 
6 — место мобильного клиента; Т — место удаленного клиента 
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Рис. 2.1.9. Последовательность работы со сканером пальца в виде переносимой 
карты 


чена для аутентификации клиентов (в том числе удаленных и 
мобильных), имеющих доступ к интеллектуальным средам ши- 
рокого назначения. 

Пользователи, не имеющие в базах данных системы своих отпе- 
чатков, хранят их на смарт-картах. В этом случае аутентификация 
клиента осуществляется путем сравнения информации (закодиро- 
ванного отпечатка пальца) на смарт-карте с «живым» отпечатком, 
полученным с помощью датчика прямого доступа. 

Кроме того, фирмами, производящими оборудование в сфере био- 
метрических технологий, предлагаются переносные датчики, встро- 
енные в специальные карты и предназначенные для «мобильных» 
пользователей. Использование такой карты и получение отпечат- 
ка показано на рис. 2.1.9 [Мат00, му/у.еаз{-зВоге.сот/4есв.Вт!. 

Примером автономного устройства, передающим на расстояние 
информацию об отпечатках пальца его владельца, или, например, 
индивидуального пилота дальнего управления (телевизором, гара- 
жом, замковыми механизмами дверей автомобиля), или, наконец, 
сотового телефона с автоматической аутентификацией пользовате- 
ля, является переносное устройство РЕВМАГОС с датчиком отпе- 
чатков пальцев, показанное на рис. 2.1.10 [1п{о@4егта1оз.ае]. 

Оно используется в биометрических системах для идентифика- 
ции и верификации пользователя по отпечаткам пальцев и осна- 
щено встроенным сканирующим модулем. Идеально подходит для 
различных приложений в мобильных системах связи пользовате- 
ля с интеллектуальными средами. 

Технология распознавания отпечатков пальцев для защиты дос- 
тупа к переносному компьютеру использована при оснащении та- 
ких компьютеров системами АЕ!5 и встроенными в компьютер 
датчиками отпечатков пальцев [Соп100]. Компьютер с встроенным 
сканером отпечатков пальцев показан на рис. 2.1.11 [Соп100]. Ха- 
рактеристики реализованной в нем системы АЕ следующие: плат- 
Форма — Тарюр или МофеБооК с процессором Реп ит. Сканируе- 
мое изображение пальца: 500 ар1, 256 уровней яркости. Размер фай- 
ла для каждого эталона отпечатка пальца — от 256 байт до 4 кбайт 
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Рис. 2.1.10. Переносное устройство Рис. 2.1.11. Сканер отпечатков пальцев, 
с датчиком отпечатков пальцев встроенный в компьютер 
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Рис. 2.1.12. Терминал верификации отпечатков паль 
Размеры: 
Терминал 148 х 135 х 60 мм 
Монитор 134 х 32 точек 
Регистрация: 
Время < 1,0 зес 
Память ВАМ 32 кбайт 
Емкость памяти до 3000 отпечатков 
Верификация: 
Время 0,3 зес 
ЕВВ <1,0 % 
РАВ <0,1 % 
Дополнительные возможности: 
управление запорными механизмами дверей; 
дополнительные порты — 3 для датчиков положения двери; 
клавиатура — 10 численных клавиш, 6 функциональных клавиш 


цев ЕТТ-100: 
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Рис. 2.1.13. Устройства верификации отпечатков пальцев для систем контроля 
доступа к помещениям 





Устройство ЕЦ)-001/500 Устройство ЕЦ)-710 

Размеры 42х42 х 92,5 мм 9,5х 54х 85,6 мм 
Регистрация: 

Время <1,0с 1,0с 

Память ВАМ 4 Мбайт 512 кбайт 

Размер файла отпечатка 256 байтов на отпечаток — 

Эталон — 512 байт на отпечаток 

Размер отпечатка — 128 х 192 пикселей 

Емкость памяти 1000 отпечатков — 
Верификация: 

Время 0,3 с Те 

ЕВВ <1,0 % (по двум результатам) 1% 

РАВ <0,1 % 0,1 % 


(взависимости от приложений). Память позволяет сохранять до 10000 
эталонов. Независимость качества сканирования и получаемого ре- 
зультата от поворота пальца на сканере в плоскости ХУ. Способ 
сравнения с эталоном: один с одним или один с многими. 

В заключение настоящего раздела скажем об отдельном клас- 
се устройств, включающих в себя как сканеры отпечатков паль- 
цев, так и системы АЕ!$. Это терминалы и устройства верифика- 
ции отпечатков пальцев, которые предназначены для систем кон- 
троля доступа к закрытым помещениям. С этой целью они 
содержат встроенные системы управления запорными механиз- 
мами дверей и порты для подключения датчиков положения две- 
ри. Внешний вид, например, терминалов фирмы Бопу и их харак- 
теристики представлены на рис. 2.1.12 и 2.1.18. 


2.1.4. СРАВНЕНИЕ ОТПЕЧАТКОВ ПАЛЬЦЕВ 


В технической литературе, посвященной проблемам автомати- 
ческой идентификации и верификации отпечатков пальцев (в си- 
темах АЕ[З), наиболее часто упоминается метод, основанный на 
выделении и сопоставлении минуций. Описанию и применению 
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этого метода посвящено много публикаций различных авторов, 
однако наиболее полно, с приложением соответствующих блок- 
схем алгоритмов, этот метод представлен в работах [а19Та,Ъ]. 
Ниже изложим кратко его суть в соответствии с представления- 
ми работ [3а197Та,Ъ]. 

Метод включает следующие этапы: 

1) улучшение качества исходного изображения отпечатка; 

2) вычисление поля ориентации папиллярных линии исходного 
отпечатка; 

3) бинаризация изображения отпечатка; 

4) утончение линий изображения отпечатка; 

5) выделение минуций и запись их параметров в вектор; 

6) сопоставление минуций. 

Кратко опишем каждый этап и представим некоторые иллю- 
страции. 

Улучшение качества исходного изображения отпечатка. Обыч- 
но с этой целью реализуется либо низкочастотная фильтрация, 
либо нормализация, призванные поправить структуру гребней па- 
пиллярных линий и улучшить резкость их границ. 

Вычисление поля ориентации папиллярных линий. При этом 
все изображение разбивается на блоки, например, Вх В пикселей 
(В>5, целое) и для каждого блока (по градиентам яркости в бло- 
ке) вычисляется один угол 9 ориентации папиллярных линий. При- 


мер результата вычисления поля ориентации для фрагмента от- 
печатка пальца представлен на рис. 2.1.14. 

Бинаризация изображения отпечатка. Процедура реализует- 
ся пороговой обработкой. 

Утончение линий изображения отпечатка. Выполняется про- 
цедурой утончения линий бинарного образа до тех пор, пока эти 
линии не станут равными одному пикселю. Результат двух по- 
следних операций показан на рис. 2.1.15 на образах, отмеченных 
цифрами 2 и 3. 

Выделение минуций. Реализуется локальной обработкой всего 
изображения отпечатка пальца с помощью маски 9х 9 пикселей и 
подсчетом числа пикселей, находящихся вокруг центра маски и 
имеющих ненулевые значения. Пиксель в центре маски принима- 
ется за минуцию, если он сам имеет ненулевое значение и если 
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Рис. 2.1.14. Фрагмент отпечатка (1) и поле ориентации (2) его папиллярных л я 
иний 
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Рис. 2.1.15. Результаты бинаризации и утончения линий изображения отпечатка 
пальца 


число «соседей» (например, величина 5) также ненулевое и равно 1 
или 2. При этом, если 5 =1, то обнаруженная минуция является 
минуцией типа «окончание» гребня, а при 5 = 2 тип обнаруженной 
минуции — «раздвоение» гребня (рис. 2.1.16). Пример определе- 
ния минуций, их типа и угла ориентации представлен на рис. 2.1.17. 
В рассматриваемом алгоритме этот угол определяется по вычис- 
ленному заранее полю ориентации в соответствии с координатами 
найденной минуции. 

Координаты обнаруженных минуций, а также углы их ориен- 
тации записываются в вектор минуций в следующей форме: 


то = [(.д, 6.) (они, ва (аъ, (евьиь,6ь] (2.1) 


где параметр р определяет число минуций. 

На этапе регистрации пользователей системы АЕ!Г$ вектор (2.1) 
определяет эталон ЕФ), который записывается в базу эталонов. 
На этапе разпознавания вектор (2.1) определяет текущий отпеча- 
ток О® и его параметры. 

Заметим, что в реальной ситуации два отпечатка одного и того 
же пальца, полученные один за другим на одном и том же скане- 
ре, будут отличаться друг от друга поворотом относительно одной 
из осей, смещением узора отпечатка относительно осей АУ, 
несколько различной деформацией узора (или нелинейными иска- 
жениями узора), возможными изменениями масштаба представ- 
ления отпечатков и, наконец, разными периферийными участка- 
ми реального пальца (рис. 2.1.18, верхняя часть). 
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Рис. 2.1.16. Определение параметров минуций 


Совокупность отмеченных различий не позволяет однозначно 
утверждать, что один отпечаток может быть получен из другого 
простым аффинным преобразованием. И в этом — главная про- 
блема сопоставления отпечатков пальцев. 

В приложении к записи отпечатков в форме (2.1) отмеченное 
выше различие в отпечатках означает, чтор = 4 и, следовательно, век- 
торы Е®) и О® имеют различную длину. Очевидно, что эти векторы 
содержат и некоторое число минуций, вообще не соответствующих 
друг другу. Изменения в пространстве минуций для пяти отпечат- 
ков одного и того же пальца отчетливо видны на рис. 2.1.18 (см. 
нижнюю часть рисунка). 

В связи с отмеченным процесс сопоставления минуций должен 
быть реализован не за одну итерацию комплектно для всей их 
совокупности, а итерационно для каждой отдельной минуции. И в 
этом заключается главная проблема сопоставления минуций. 

С учетом изложенного выше и в соответствии с методологией 


работ [4а197а,Ъ] процесс сопоставления минуций состоит из трех 
частей: 





















































Рис. 2.1.17. Определение минуций (а), их тинов (Ъ) и углов (с) ориентации 
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Рис. 2.1.18. Отпечатки одного и того же пальца и соответствующие им минуции 

















































1) регистрация данных; 

=. м пар соответствующих друг другу г, __ 

3) оценка меры согласования двух сопоставляе пт. 

Регистрация данных. Под регистрацией в данном мы о- 
нимается определение таких параметров аффинных преобразова- 
ний — угла поворота, масштаба и сдвигов (Ах и Ду), при которых 
некоторая минуция вектора ОФ будет согласована с некоторой 
минуцией вектора Е®). Для того чтобы решить эту задачу (при 
условии а=р), необходимо выполнить пересчет координат каж- 
дой минуции из вектора О® для всех возможных изменений зна- 
чений параметров поворота, масштаба и сдвигов. 

Положим, что угол поворота Ф, на который могут быть повер- 
нуты относительно друг друга два отпечатка пальца, составляет 
Ф=15°. И пусть точность определения угла составляет 1°. Тогда 
пересчетов, связанных с определением только угла поворота, бу- 
дет 30. В общем случае их будет 2Ф. 

Если при этом параметры сдвига изменяются в пределах 


Ах = Ах1,...Ахми Ду=Аи,..., Дух, (2:2) 
а масштабный коэффициент 
Е=А:, Ко, .... Г» (2.3) 


то общее число пересчетов координат одной только минуции со- 
ставит 2Ф ММГ. 


Поиск пар соответствующих друг другу минуций. Итак, на 
каждом шаге (из 2Ф ММГ возможных) координаты минуции из 
вектора О подвергаются аффинным преобразованиям, и полу- 
ченные новые координаты сопоставляются с каждой из коорди- 
нат минуций вектора Е®). Речь здесь идет не о пунктуально точ- 
ном совпадении координат (хотя и такое возможно), а о прибли- 
жении одних координат к другим с некоторой ошибкой, но при 
этом ориентация пар минуций должна быть одинаковой. Сказан- 
ное иллюстрирует рис. 2.1.19, где согласованными парами счита- 
ются только минуции, отмеченные цифрами 1 и 2. Пара 3 согла- 
сована по координатам, но не согласована по ориентации; пара 4 
не согласована по координатам (одна из них выходит за г. и 
поля, в котором обеспечивается требуемая точность) и, н о 
цифрой 5 отмечен случай ненахождения соответствую : о 
Согласованные пары минуций в дальнейших Е В Г 
ставления не участвуют (если не идет речь о новом этал нь 

Оценка меры согласования двух сопоставляемых отп _— 

В процессе поиска пар минуций в памяти сохраняется Я 
ция о параметрах {Ах, Ду, ДЕ, ДФ}, при которых найдена па: ь ры. 
подсчитывается число найденных пар минуций бов жи 
число буквой Л). ком это 


Если одинаковая информация о параметрах {Лх, Ду, ДЕ, Д 
вторяется довольно часто, то это свидетельствует о высок о 
стве согласования отпечатков и определении истинных ое 

амет- 


32 


| 









(2.3) 


ущии 5 


Дтак, НА 
ди 3 
11 полу. 
коорд 
Но то" 











а. неа 
н а т 1 й 
Н К р Г р 
' ' ! т ! О 
р сс О : р 

ПМТ | , р 
1 р 1 1 1 О 
и Пе й р р 
г вт й р р 
е-------- Ен. 5 рее д - 





Рис. 2.1.19. Варианты решений поиска пар при сопоставлении минуций 


ров аффинных преобразований, связывающих два отпечатка меж- 
ду собой. В этом случае число итераций согласования может быть 
уменьшено за счет применения найденных параметров ко всем 
оставшимся минуциям. 


Количественную оценку согласования получают следующим 
образом [3а197]: 


_Р.2.100% 
ра ‘ 


Ко (2.4) 


Ясно, чем ближе показатель Ко к 100%, тем лучше согласу- 
ются два сравниваемых отпечатка между собой. Например, для 
результата, представленного на рис. 2.1.18, показатель (2.4) нахо- 
дится в пределах от 65 до 80% (результат получен в системе 
«УенЕшеег У3.3» для отпечатков из базы В1отейг1с бузфет ГаБ 
[Е1100]). Наивысшее значение показателя (2.4) соответствовало 
сравнению эталона (на рисунке отмеченного буквой Е) с образами 
1и2, а наименьшие — с образами 3 и 4. Как показали результаты, 
выдаваемые системой «Уег1Ешеег УЗ.3» во всех четырех случаях, 
верификация прошла успешно. 

Если согласование выполнялось в задаче верификации отпе- 
чатков, то на этом весь процесс заканчивается. Если же согласо- 
вание выполнялось в задаче идентификации отпечатков, то опи- 
санный процесс надо повторять для всех эталонов базы минуций. 
В некоторых системах идентификации из базы выбирают 10 эта- 
лонов, которым соответствуют оценки (2.4), превышающие неко- 
торый заданный порог. За окончательный результат принимает- 
ся тот вариант идентификации, для эталона которого получено 
максимальное значение оценки (2.4) из этих десяти. 


2.1.5. НЕСКОЛЬКО СЛОВ 
О ДРУГИХ ПОДХОДАХ К РЕАЛИЗАЦИИ АЕ 


Несмотря на высокую надежность представленного выше ме- 
тода распознавания отпечатков, до настоящего времени не пре- 
кращаются поиски еще более совершенных подходов к реализа- 
ции АЕ. Представим еще два метода, реализующие сравнение 


двух отпечатков пальцев между собой: 
® основанный на использовании глобальных признаков [Ва$96]; 
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рах признаков «ядро» и «дельта» (дуга): 


© — ядро; №. — Деле (дуга) 
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® основанный на преобразованиях исходных изображений от- 
печатков пальцев в форму специальных графов и сравнении их с 
аналогичными графами базы эталонов [Сар99]. 

В методе, основанном на глобальных признаках, основным 
является обнаружение на области выделенного образа (или на 
папиллярных узорах) таких признаков, как ядра и пункты «дель- 
та». Число таких признаков и их взаимное расположение позво- 
ляет однозначно классифицировать тип узора. Расстояние между 
признаками, наклон соединяющих их линий дают дополнитель- 
ную информацию для классификации каждого конкретного от- 
печатка. 

Пример выделения признаков на типичных узорах отпечатков 
пальцев представлен на рис. 2.1.20 [Ва{96]. Классификация пред- 
ставленных папиллярных узоров обсуждалась в разделе 2.1.1 и 
соответствует узорам на рис. 2.1.1. Представленный в [Ваф96] 
подход использован для предварительной классификации отпе- 
чатков пальцев. Окончательное распознавание реализовано на 
основе локальных признаков. Такой итерационный подход обес- 
печивает режим реального времени при работе с большими база- 
ми данных. 

Определение типа узоров на пальцах может представлять и 
самостоятельный интерес, поскольку по папиллярным узорам паль- 
цев можно узнать характер, темперамент и способности человека, 
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Рис. 2.1.21. Преобразование изображения отпечатка пальца в форму специально- 
го графа и определение меры его подобия с эталонами 
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а также определить, что ждет человека в будущем [Пер98]. В ре- 
шении и этих задач может быть полезен подход, представленный 
в [Ва 96]. 

Идеи второго метода, основанного на «графовом представле- 
нии» отпечатков пальцев, иллюстрирует схема, показанная на 
рис. 2.1.21 [Сар99]. в 

В соответствии с этой схемой каждое исходное изображение 1 
отпечатка пальца преобразуется в новое изображение 2, представ- 
ляющее поле ориентации папиллярных линий. На таком изобра- 
жении легко заметить области с неизменной ориентацией папил- 
лярных линий. Изображение «с ориентацией» делится на эти об- 
ласти по своим границам, в результате чего получается изображе- 
ние 3. Далее определяют центры выделенных областей, соединяя 
которые получают некоторый уникальный граф (см. изображе- 
ние 4), представляющий конкретный отпечаток пальца. Описанный 
процесс отмечен стрелками ‹а»—«с». Стрелкой «А» отмечена за- 
пись графа в базу эталонов (блок 6) на этапе регистрации отпечат- 
ков или в базу текущих данных в процессе распознавания нового 
отпечатка. 


Определение меры подобия вновь полученных графов с графа- 
ми из базы эталонов реализуется отдельным блоком 5. 


Вместо заключения 


Идентификация личности на основе отпечатков пальцев поз- 
воляет упростить и ускорить (автоматизировать) многие выпол- 
няемые человеком операции, поскольку тривиальное удостовере- 
ние личности (которое можно не только забыть, нои утратить...) 
заменяется отпечатком собственного пальца. При этом гаранти- 
руется высокая точность и надежность идентификации человека, 
что неоднократно отмечалось и было проиллюстрировано при 
представлении характеристик конкретных АЕ!$. 

С использованием АЕ! надежно решаются следующие зада- 
чи: банковские транзакции любых видов, в том числе получение 
пенсий и пособий, аутентификация карт и водительских прав 
(а также их замена отпечатком пальца), задачи пограничного кон- 
троля/идентификации и иммиграционной регистрации, регистра- 
ция избирателей в дни выборов, допуск на рабочие места и регис- 
трация служащих на рабочих местах, идентификация посетителя 
частного дома, постоянного покупателя магазина, клиента других 
социальных служб и др. 

При этом заметна тенденция использования семейных АЕ! 
для целей контроля доступа к личному имуществу — домам, га- 
ражам. Для этих приложений разработаны автономные компакт- 
ные и в то же время функционально универсальные терминалы 
идентификации (аутентификации) человека по отпечаткам паль- 
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ца. Такие терминалы включают кроме основного устройства — 
сканера отпечатка пальца — много дополнительных устройств, и 
в том числе системы управления замковыми механизмами две- 
рей, интерфейсы для подключения датчиков положения дверей, 


считыватели карт, клавиатуру для ввода паролей и РИМ ?ов, что 
существенно облегчает их инсталяцию и обслуживание, а также 
гарантирует широкое применение. Вот уж действительно, насту- 
пает эра, когда палец становится ключом [Мат00]. И сегодня уже 
говорят о защите доступа к сугубо личным предметам (опасным 
в чужих руках), таким, например, как оружие. 

Криминалистика и правосудие — также известные сферы при- 
ложения АЕ[ГЗ, что отмечалось уже выше. 

Интенсивно и экстенсивно расширяется применение биомет- 
рических систем класса АЕ!$ и в сфере высоких технологий, где 
решаются две основные задачи — контроль доступа к информа- 
ционным ресурсам и идентификация их пользователей. Причем 
появились так называемые «мобильные пользователи», реализу- 
ющие доступ к информационным ресурсам по радиотелефонным 
линиям. Их идентификация выполняется как бы «на ходу», напри- 
мер через системы сотовых телефонов. При этом заметна и тен- 
денция защиты персональных информационных ресурсов — пер- 
сональных компьютеров (в том числе ноутбуков) и доступа к ним, 
а также доступа к ресурсам через мобильные каналы, например 
через сотовые телефоны. С использованием мобильных АЕ[З эти 
задачи легко решаются. 

Если же говорить о будущем биометрики, то, как уже говори- 
лось, по узорам на пальцах можно не только идентифицировать 
человека, но и предсказывать, будущее человека. «Ученых давно 
интересовали узоры на пальцах, которые характеризуются своей 
уникальностью и неизменностью в течение жизни. Наука, которая 
занимается считыванием и интерпретацией информации с пальце- 
вых (папиллярных) узоров, называется дерматоглифика» [Пер98]. 

Если говорить о перспективах применения технологии отпечат- 
ков пальцев, то очень скоро она выйдет за рамки простых систем 
АЕГЗ, «поскольку на кончиках пальцев можно читать так же, как в 
медицинской карте или в милицейском протоколе. По папилляр- 
ным узорам можно узнать характер, темперамент и способности 
человека». 

Как отмечено в [Пер98], уже в течение нескольких лет дерма- 
тоглифику используют при изучении возможностей спортсменов. 
Сегодня уже точно установлено, что человек с узором «дуга» до- 
бъется победы только в таких видах спорта, как коньки-спринт и 
шорт-трек. А самый сложный узор — спираль (завитки) или двой- 
ные петли — встречаются у чемпионов по вольной борьбе, тяже- 
лой атлетике, фехтованию. В будущем ученые надеются расшиф- 
ровать назначение и детали всех узоров. 

Для реализации подобных проектов имеется буквально все — 
датчики, устройства и терминалы для получения отпечатков паль- 
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цев, методы, алгоритмы и программное обеспечение для выделе- 
ния и классификации папиллярных узоров, их деталей и базы дан- 
ных, представляющие собой материал для анализа, в том числе 
папиллярные узоры известных исторических и популярных личнос- 
тей и т. д. 


2.2. ТЕХНОЛОГИЯ, 
ИСПОЛЬЗУЮЩАЯ ГЕОМЕТРИЮ РУКИ 


«Рука — вышедший наружу мозг», — писал философ Кант. Что 
он хотел этим сказать? А именно то, что руки отражают наш внут- 
ренний мир. При этом ладонь — инструмент, который у нас «всегда 

под рукой» в прямом и переносном смысле [Лев99]. И практически 
все о конкретном человеке можно прочитать по его руке. 
| Однако в биометрике в целях идентификации (или верифика- 
ции) человека используется пока только простая геометрия руки — 
ее размеры и форма, а также некоторые информационные знаки 
на тыльной стороне руки. К последним относятся образы на сги- 
бах между фалангами пальцев и узоры расположения подкож- 
ных кровеносных сосудов [С0197, бап00]. 


Как следует из отчета международной группы по биометрике 
| (ВТС), технология идентифи 
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зуют свои разработки в системах 

Вообще же с руки можно «снять» до 90 информационных зна- 
ков. В биометрике, например, совершенно не используется инфор- 
мация об узоре на ладони, а она также уникальна (рис. 2.2.1, левая 
часть), как уникальна судьба и жизнь каждого человека. Боло 
но, за этим — будущее биометрики, использующей информацион- 
ные знаки руки. 

Информационные знаки руки. В биометрике, использующей 
теометрию руки, прослеживаются два основных подхода. Первый 
(существует уже более 25 лет — от зарождения биометрических 
систем контроля доступа к помещениям) основан исключитель. 
но на геометрических характеристиках кисти Руки, второй (более 
современный) — на смешанных характеристиках геометрических 
и образовых. К последним, как уже отмечалось, относятся образы 
на сгибах между фалангами пальцев, узоры (расположение) под- 
кожных кровеносных сосудов. 
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Рис. 2.2.1. Узор на ладони, состоящий из пяти важнейших линий (слева), конт- 
рольные точки и 17 геометрических признаков руки (справа) 


Суть первого подхода иллюстрирует рис. 2.2.1, где с левой сто- 
роны показан отпечаток руки, а с правой — ЗП) геометрия руки. 
В рассматриваемом подходе вся интересующая нас информация 
собрана в отличие от отпечатка руки в горизонтальном и верти- 
кальном силуэте ее кисти. 

На рис. 2.2.1 показаны контрольные (характеристические) точ- 
ки силуэта руки и 17 исходных геометрических признаков руки 
[Со197], в данном случае отмеченные отрезками прямых линий, кото- 
рые не входят в силуэты кисти. Как видно, исходными биометриче- 
скими признаками руки являются ширина ладони, радиус вписанной 
в ладонь окружности, длины пальцев (определяемые как расстоя- 
ния от выделенных верхних контрольных точек до середин линий, 
соединяющих нижние контрольные точки), ширина пальцев и высо- 
та кисти руки в трех пунктах, отмеченных линиями а, Бис. 

В некоторых других подходах, в том числе в рассматриваемом 
в [бап00], приведен 21 исходный геометрический признак руки, 
из которых 17 совпадают с признаками, показанными на рис. 2.2.1. 

В системах верификации личности человека по геометрии руки 
используются не все, а только некоторые из этих исходных при- 
знаков, а также другие, полученные из исходных при их матема- 
тической обработке [Зап00]. Такими признаками, например, мо- 
гут служить углы между контрольными точками, средние значе- 
ния и дисперсия значений исходных признаков. 

Особенностью рассмотренного способа получения биометриче- 
ских характеристик руки является его простота, а также то, что 
каждый эталон руки может быть записан очень компактно в фор- 
ме некоторого вектора значений признаков. 
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Процесс обработки исходной информации и | бони тЫ 
цесс идентификации (аутентификации) людей также чрезвычай- 
но прост [Зап00]. Он сводится к следующему: 

1) от каждого пользователя получают несколько Реутов руки, 
для каждого из которых получают вектор значении признаков; 

2) все векторы признаков одного человека объединяются в от- 
дельный класс в признаковом пространстве; 

3) признаки образа-эталона в классе определяются как сред- 
ние значения соответствующих признаков всего класса (т.е. об- 
раз-эталон представляет центр каждого класса); 

4) исходные признаки и/или пространство исходных призна- 
ков модифицируются (пересчитываются в новые признаки или 
слегка редуцируются на основе селекции признаков); 

5) образы-эталоны также изменяются в соответствии с выпол- 
ненной выше модификацией; 

6) новый образ классифицируется в пространстве исходных или 
модифицированных признаков (в зависимости от операций, выпол- 
ненных в пунктах 4 и 5) при его сравнении с образом-эталоном. 

Мерой подобия сравниваемых образов может служить, напри- 
мер, расстояние в метрике Г, между новым образом и центрами 
классов: чем меньше это расстояние, тем ближе новый образ к 
соответствующему классу. 

Если в биометрической системе выполнялась процедура аутен- 
тификации, то оценивается расстояние между новым образом и 
известным эталоном, и при этом вычисленное расстояние не мо- 
жет превосходить заданное значение. В противном случае счита- 
ется, что аутентификация не подтверждена. 

Однако к применению подобных биометрических систем нуж- 
но относиться крайне осторожно, поскольку не составляет боль- 
ого труда изготовить простой (например, из картона и пласти- 
лина) муляж кисти руки с характеристиками санкционированно- 
го (зарегистрированного пользователя) и использовать этот муляж 
для несанкционированного доступа в систему. 

Суть второго подхода — «снятие» с руки четырех характерис- 
тик, из которых три являются скалярами и относятся к размерам 


пальцев, а четвертая — представляет собой полутоновое изображе- 
ние складок кожи на сгибе между фалангами. 

Способ получения всех четырех характеристик показан 
рис. 2.2.2. Три первые характеристики — это птирина указат == 
ного пальца 1, высота указательного пальца 2 и длина сре очи 
пальца 3, оцениваемая так, как показано на рис. О араино 
ка4 в рассматриваемом случае представляет собой изображен ь 
складок кожи на сгибе между средней и нижней Ффалангами ых 
зательного пальца. Как утверждают некоторые рекламные о 
ники компании Весоёп1оп Зуз$етз шс, вся инфо аа 


рмация о рукев 
рассматриваемом классе систем может быть записана не боле 
чем 9 байтами. > 
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Рис. 2.2.2. Один из вариантов биометрических характеристик руки 


Наличие биометрической характеристики руки в форме полу- 
тонового изображения существенно затрудняет изготовление му- 
ляжа, который может быть использован для взлома системы иден- 
тификации. При этом следует заметить, что фирмы, поставляю- 
щие на рынок коммерческие системы идентификации человека 
по его руке, не предоставляют конкретной информации о призна- 
ках (характеристиках) руки, используемых в своих системах. 

Поэтому вместо варианта четвертой характеристики, показанной 
на рис. 2.2.2, в конкретной биометрической системе может быть 
выбрана какая-либо другая или несколько. Незнание этой инфор- 
мации также усложняет изготовление муляжа руки и уменьшает 
вероятность физического доступа к системе. 

Устройства для получения информации о руке. Для получения 
параметров кисти руки существуют различные сканеры (рис. 2.2.3 
позиции 1 и 3). 

На рис. 2.2.3, позиция 2 показан способ фиксации руки в устрой- 
ствах в процессе ее сканирования. И это, пожалуй, единственное спе- 
цифическое требование при сканировании руки. Никаких других 
особых требований, в том числе к температуре, влажности и чистоте 
рук устройства этого класса не предъявляют (\\\.гесозуз.сот/ 
ргоЧис{з /ассеззот1ез). Последнее обстоятельство позволяет применять 
устройства рассмотренного класса в различных производственных 
Условиях. 

Технология, использования геометрии руки. Некоторая гро- 
моздкость представленных устройств связана с использованием 
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Рис. 2.2.3. Сканеры (1, 3) геометрии руки и способ фиксации в них руки (2) 


в них телевизионной камеры, специальной системы подсветки руки 
и уголкового зеркала, отражающего боковой образ руки на объек- 
тив камеры. Возможно, что именно габариты сканеров рук опре- 
делили сферу их применения (в основном в системах контроля 
доступа к закрытым помещениям и различного рода объектам). 

Широко известны следующие примеры применения данной 
технологии на практике: 


1) контролировался доступ в Олимпийскую деревню (г. Атлан- 
та, США) на Играх 1996 г.; 


2) контролируется доступ в помещения и на объекты аэропор- 


тов, перемещения персонала по территории аэропортов, при полу- 
чении багажа, контролируются пассажиры при выходах на посад- 
ку в самолеты. Например, в международном аэропорту в Сан- 
Франциско установлено более 90 сканеров геометрии рук; 

3) работают системы идентификации (верификации) клиентов 
банков, а также системы контроля доступа в спе 
щения/хранилища в банках. Более 100 с 
установлено в банках России; 

4) контролируется доступ на объекты, 
персонала на атомных электростанциях (США, Япония, Канада); 

5) функционируют системы аутентификации людей в службе 
иммиграции и натурализации США, используемые в рамках про- 
граммы ПМ5РА$$. ы 


циальные поме- 
канеров геометрии рук 


а также перемещения 


2.3. ТЕХНОЛОГИЯ, 
ИСПОЛЬЗУЮЩАЯ РАСПОЗНАВАНИЕ лиц 


Во введении отмечалось, что для интеллек 
дующего поколения лучше всего подходят технологии идентифи- 
кации человека по его лицу. Как отмечено в [Реп00], эти техно 
гии ‹ненавязчивы (распознавание происход о: 


ит на расстоянии, не 
задерживая и не отвлекая человека), они, как правило пассивны 
, 


туальных сред сле- 
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(не требуют специальных действий со стороны человека), не ограни- 
чивают пользователя в свободе перемещений и к тому же относи- 
тельно недороги. Но самое важное, по-видимому, то, что люди обыч- 
но узнают друг друга по лицам довольно просто и, значит, не будут 
испытывать неудобств с подобными (биометрическими) систе- 
мами». 

Кроме того, на лице каждого человека «написаны» его история, 
симпатии и антипатии [Тен95], а в рамках физиогномики [Вел98, 
Гон97] по лицу человека можно определить, что это за человек, 
каково его предназначение, какими он «наделен» болезнями, в 
каком эмоциональном состоянии находится в настоящий момент 
и каковы его чувства и намерения по отношению к окружающим 
его людям. 

Как первое, так и второе определяют практический интерес 
для компьютерного (автоматического) распознавания лиц вообще 
и решению задач идентификации и аутентификации человека по 
его лицу в частности. Именно эти проблемы и задачи решаются 
соответствующими системами в рамках биометрики и на основе 
биометрических характеристик лица. 

Информационные знаки лица человека. При обычном анали- 
зе лица человека обращают на себя внимание следующие инфор- 
мационные знаки [Вел98]: 

— форма лица (например, круглая, квадратная, треугольная...); 

— соотношение частей лица между собой (лоб, средняя и ниж- 

няя части лица); 

— форма лба, скуловой области и подбородка; 

— форма и размер ушной раковины, способ ее прикрепления, 

а также форма частей ушной раковины (мочки, козелок, про- 
тивокозелок); 

— симметрия лица (симметрия или явная асимметрия); 

— форма, величина и местоположение глаз, рта, носа; 

— линии локализации морщин и т. д. 

В методах автоматического распознавания лиц по видеопорт- 
ретам используют эти же информационные знаки в различных 
их сочетаниях, что в большинстве случаев определяется тем, ка- 
кой именно портрет распознается — ориентированный в фас, в про- 
филь или одновременно два портрета: в фас и профиль. Если же 
говорить о коммерческих системах, то они ориентированы на рас- 
познавание лиц, представленных в фас (с возможным поворотом 
и с наклоном головы не более + 15°), в связи с чем практически 
не используют информационные знаки ушных раковин и про- 
филь лица. Хотя некоторая информация о профиле все же может 

быть получена и из изображения лица строго в фас. 

При этом два источника информационных знаков лица — глаза 
и ушные раковины — представляют собой самостоятельные ис- 
точники биометрических характеристик человека и определяют 
отдельные направления в биометрике. 
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2.3.1. ОБЗОР МЕТОДОВ РАСПОЗНАВАНИЯ ЛИЦ 


Результат распознавания лиц автоматической системой зави- 
сит от качества исходных данных (например, фото- и видеопорт- 
ретов); выбора исходных информационных знаков лица и/или 
способа выделения признаков из них; метода, используемого для 
распознавания, и критериев распознавания. 

Если говорить о методах, то в технической литературе, посвя- 
щенной проблеме автоматического распознавания лиц, наиболее 
часто ссылаются на основополагающие публикации [К1Г90, Тиг91, 
Вги93, Ве!97], представляющие следующие методы: 

® корреляционный метод (метод согласованной фильтрации); 

® метод, основанный на преобразовании Карунена—Лоэва и по- 
нятии «Е!сеп{асе» (собственных лиц); 

® метод, основанный на линейном дискриминантном анализе 
и понятии «Е1зВегРасе», названном так в честь Роберта Фишера, 
использовавшего дискриминантный анализ в распознавании обра- 
зов. 

Относительно простым среди перечисленных является корре- 
ляционный метод. Обычно он реализуется в пространстве исход- 
ных признаков (исходных изображений) и аналогично тому, как 
реализуется согласованная фильтрация. Важен сам факт суще- 
ствования корреляции между распознаваемым образом лица и 
эталоном, хранящимся в базе данных. Если условия получения 
новых образов соответствуют условиям получения эталона (осве- 
щение, пункт наблюдения лица, определяющий его наклон и по- 
ворот, масштаб, фон и т. д.), то корреляция между ними близка 
к единице, а уровень распознавания в целом доходит до 96 % 
[Вги93]. Однако, если фон, масштаб, повороты и наклоны изменя- 
ются, то обычная линейная корреляция не устанавливает подобия 
двух образов и становится практически бесполезной. 

Развитием корреляционного метода является переход от ис- 
ходного пространства признаков (исходного изображения) к про- 
странству инвариантов Фурье— Меллина (элиминирующих мас- 
штаб и заменяющих поворот на циклический сдвиг), что позволя- 
ет на основе той же самой согласованной фильтрации достичь 
высоких оценок корреляции между двумя образами [СВе94, Веп98] 
Проблемой по-прежнему здесь остается высокая размерность про. 
странства признаков, соответствующая размерам исходных изоб- 
ражений и, кроме того, преобразование Фурье—Меллина суще- 
ственно усложняет весь вычислительный процесс согласованной 

фильтрации. 

Метод, использующий преобразование Ка 
ляет осуществить значительную редукци 
ства признаков, оставляя для дальнейшег 
те из них, которые имеют принципиально, 
ного класса образов. При этом непосред 
вий получения образов на его представл 
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рунена—Лоэва, позво- 
ю исходного простран- 
о использования только 
е значение для конкрет- 
ственное влияние Усло- 
ение в Редуцированном 





пространстве признаков становится не так заметно, а сравнение 
образов в этом пространстве значительно упрощается. Уровень 
правильного распознавания здесь стабильно достигает 80 % даже 
при заметных изменениях условий получения образов лиц по 
сравнению с условиями получения эталона. 

Метод, основанный на линейном дискриминантном анализе, 
так же как и предыдущий, позволяет реализовать редукцию ис- 
ходного пространства признаков, при этом он существенно улуч- 
шает кластеризацию образов в редуцированном пространстве 
признаков. Последнее обеспечивает еще более высокий уровень 
распознавания, доходящий до 99 % даже при изменениях усло- 
вий получения образов. 

На сегодняшний день основное развитие при распознавании лиц 
получили методы, ориентированные на следующее: 

а) репрезентативный характер исходных данных — использова- 
ние для обучения системы распознавания того диапазона измене- 
ний образов лиц (освещение, ориентация, масштаб, фон ит. д.), в рам- 
ках которого система должна распознавать все другие образы; 

6) уменьшение размерности исходных данных — применение 
редукции исходного пространства признаков с представлением 
исходных образов в редуцированном пространстве признаков; 

в) реализацию процесса распознавания в редуцированном про- 
странстве признаков; 

г) использование процедур сопоставления распознаваемого об- 
раза с эталоном с оценкой меры подобия между ними (на основе 
какой-либо метрики), используемой в качестве критерия распо- 
знавания. 

В связи с изложенным выше в настоящем разделе будет дан 
обзор систем распознавания, использующих базы, которые призва- 
ны обеспечить репрезентативность исходных данных, и систем, в ко- 
торых редукция признаков основана на методах анализа главных 
компонент (англ. РСА), преобразовании Карунена—Лоэва (КЛ, 
англ. КГТ) и линейном дискриминантном анализе (англ. ТОРА”). 
Обоснованием для их детального представления может служить 
тот факт, что большинство реализованных в последнее время на 
практике систем распознавания людей по их лицам используют 
именно эти подходы и методы [Сот96, Б\е96, Ноп98, Гат 98, М198, 
Тза98, З\ие99, Тлл00, Гла97, Гла97, Сам98 и др.]. Наконец, о важности 
перечисленных выше методов в решении проблемы «Касе Весоёп1- 
101» и в приложении к коммерческим биометрическим системам 
свидетельствует также обзор, представленный в специальном выпу- 
ске журнала «Сотрщег» [Реп00, Отс00]. 

Очевидно и то, что практическое применение этих, относитель- 
но непростых (с вычислительной точки зрения), методов стало 





"РСА Ргшс!ра! сотропеп$ апа!уз1з, [РА — ШМпеаг 91зстии пап апа|уз!з, 
КГТ — Кагнипеп—Тоеуе Тгапзёогтайоп, ПКЛ — преобразование Карунена— 
Лоэва, ЛДА — линейный дискриминантный анализ. 


45 











возможным благодаря мощному развитию вычислительных 
средств, в том числе ресурсов персональных компьютеров, исполь- 
зуемых в биометрических системах. 


2.3.2. БАЗА ДАННЫХ ИЗОБРАЖЕНИЙ ЛИЦ 


Если говорить о качестве исходной базы данных, то здесь под- 
разумевается: 


© ее репрезентативность; 














3 4-5 [< 9 | 














Рис. 2.3.1. Первые 10 классов образов базы данных ОБТ, РафаБаз Е. 
е 01 Еасез 
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® факт и/или способ структурирования данных; 
® качество самого образа, в том числе: 
размер каждого образа, вы 
селей; 


контраст и прорисовка деталей лица; 
фон, на котором находится основная часть лица; 
отсутствие мешающих деталей на области лица и т. д. 

В свою очередь, репрезентативность базы данных (лиц) и способ 
ее структурирования, выраженные, например, в числе классов и числе 
образов в каждом классе, определяются необходимостью наличия 
в базе образов лиц с различным поворотом головы — вверх/вниз, 
влево/вправо и их комбинаций, присутствием или отсутствием 
дополнительных предметов (очки, серьги...), а также различным 
выражением на них. Важно при этом еще и соблюдать более или 
менее одинаковые условия получения образов лиц (освещенность, 
размер самого лица на фоне всего образа, незначительные возраст- 
ные изменения лиц, представленных в каждом классе). 

Довольно часто для тестовой проверки качества систем распоз- 
навания используется база данных ОВЛ, РафаБазе о{ Гасез [Ог1**] 
как отвечающая вышеперечисленным требованиям и наиболее 
доступная широкому классу исследователей проблемы «Расе 
Весогп оп». Первые 10 классов образов этой базы данных пред- 
ставлены на рис. 2.3.1. Целиком эта база данных представлена в 
Приложении. 

ОВГ Оафаьазе о{ Касез содержит 400 образов по 10 в каждом 
классе. Каждый образ представлен изображением размера 112 х 92 
пикселя в 256 уровнях градации шкалы СВАУ и всегда на тем- 
ном фоне. Фотографии, из которых получены образы лиц, выпол- 
нены в различное время (некоторые с разницей более двух лет). 
Репрезентативность данных обеспечивается некоторыми измене- 
ниями масштаба лица, угла наблюдения в момент фотографирова- 
ния (что определяет изменение наклона и поворота головы) и ус- 
ловий освещения. 

Получение более полных баз данных — процесс очень трудо- 
емкий и длительный, хотя существуют базы данных с числом 
образов, превосходящим 1000. Примером здесь может служить 
база ЕЕБЕТ [РЬ!9, Реп00], используемая для тестовой проверки 
коммерческих систем распознавания лиц. 


раженный, например, в числе пик- 


2.3.3. ВВЕДЕНИЕ В МЕТОДЫ РСА, ПКЛ И ША 


Суть анализа главных компонент и связанного с ним ПКЛ 


видна из рис. 2.3.2. 
Цель анализа — выявить основные изменчивости в изображе- 


ниях лиц (обучающем наборе исходной базы данных) и описать 
эти изменчивости при помощи нескольких собственных векторов 


(это реализуется в блоках 3—5 на рис. 2.3.2). 
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Основные изменчивости представлены матрицей ковариации, по. 
рядок которой (пусть он будет равен, например, №) соответствует 
размерности вектора исходных признаков, описывающих каждый 
образ. Собственные числа матрицы ковариации являются спект- 
ром этой матрицы в ортогональном базисе собственных векторов 
и диагонализируют ее. При этом основная изменчивость матрицы 
ковариации (а также ее основная энергия в соответствии с равен- 
ством Парсеваля) описывается всего р наибольшими собственны- 
ми числами, при этом р < М. 

В дальнейших преобразованиях участвуют только эти наиболь- 
шие собственные числа и соответствующие им собственные векторы. 

В свою очередь, ПКЛ, реализуемое в блоке 6, — ортогональное 
преобразование в базисе, сформированном из собственных векто- 





1 2 3 
База Выбор признаков Вычисление матрицы 
данных ковариации 


6 4 
Вычисление собственных 
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Рис. 2.3.2. Структура вычислений в методе РСА и ПКЛ 
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ров. Входными данными здесь являются образы, представленные 
в исходном признаковом пространстве размерности М, а выход- 
ными данными — главные компоненты: спектр, определяемый 
только р собственными векторами, выбранными выше. Таким 
образом, ПКЛ позволяет трансформировать М№-мерное простран- 
ство исходных признаков вр-мерное пространство признаков. Этот 
процесс называется редукцией пространства признаков, и имен- 
но здесь в результате ПКЛ определяются главные компоненты. 

Обратное ПКЛ для полученных значений главных компонент 
приводит к их представлению в форме «собственных лиц» (или, 
например, «эластичных моделей лиц» [Тап97]), что реализуется 
блоком Т. Полная реконструкция или аппроксимация образов 
осуществляется аналогично (блок 8). 

Каждый новый образ, предназначенный для распознавания, 
также подвергается ПКЛ в том же базисе собственных векторов 
(блок 9), в результате чего получается его представление в реду- 
цированном пространстве признаков. 

Каждый образ (из базы или новый) может быть также представ- 
лен как линейная комбинация изображений «собственных лиц» или 
аппроксимирован через параметры соответствующих эластичных 
моделей лиц. 

В редуцированном пространстве признаков значительно про- 
ще реализуется как решение задачи кластеризации образов, так и 
сравнение образов между собой, поскольку каждый из них пред- 
ставляется существенно меньшим числом признаков и только 
теми, которые описывают их главные особенности. 

При использовании метода РСА сокращается пространство 
признаков (в нашем случае в М/р раз), однако он не всегда позво- 
ляет удовлетворительно решать задачи кластеризации. 
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Рис. 2.3.3. Отображение редуцированного пространства признаков в форме ЗП: 
а — редукция для первых 20 классов образов базы; Ь — образ 10-го класса 
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Рис. 2.3.4. Структура вычислений в методе ГОА 


Для подтверждения сказанного приведем пример отображе- 
ния редуцированного пространства признаков в системе коорди- 
нат ЗО. Это пространство признаков представлено на рис. 2.3.3. 
Редукция выполнена для первых 20 классов образов базы [От] 
и первых семи образов в каждом классе. Отображены только пер- 
вые три признака для каждого образа. 


Подробнее, с обоснованием 
выбора всех параметров, этот пример описан в гл. 5. 
В правой части рис. 2.3.3 выделен образ 10-го класса, 


тикальная линия представляет средний об 
класса), а отдельные образы в классе представлены семью точка- 
ми. При этом косые линии определяют раз 


брос отдельных обра- 
зов относительно среднего образа в классе (относительно центра 
класса). 


где вер- 
раз в классе (центр 
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Оценивая результат представленной кластеризации, отметим, 
что здесь не максимизированы расстояния между классами и не 
минимизированы внутриклассовые расстояния между образами в 
классе. Иными словами, из представленного рисунка видно, что 
некоторые образы значительно отходят от центров своих классов 
и так далеко, что попадают «на территорию» соседних классов 
(перекрывают и свои и чужие классы), а сами центры классов 
имеют не совсем равномерное распределение в пространстве при- 
знаков. 

Если теперь редуцированное методом ПКЛ пространство при- 
знаков рассматривать как исходные данные, то, используя в при- 
ложении к ним метод ГОА, можно создать дополнительные воз- 
можности для редукции пространства признаков и при этом су- 
щественно улучшить их кластеризацию. 

Структура вычислений, реализуемая в методе ТЛА, показана 
на рис. 2.3.4, и, поскольку он имеет много общего с методом РСА, 
пояснений не требуется. 

Результат кластеризации пространства признаков (метод 
РСА + ГРА, реализованные в [Кис98, Кис99 и Кис00]) для базы дан- 
ных, содержащей те же 20 классов образов, представлен на рис. 2.3.5. 

Сравнивая результаты кластеризации на рис. 2.3.3 и 2.3.5, 
можно отметить, что ожидаемый эффект достигнут: отдельные 
образы в классах еще теснее концентрируются около своих цент- 
ров, практически не «залезая на чужие территории», а сами цент- 
ры отдалены друг от друга еще больше. 

Представленные подходы используются сегодня при построе- 
нии систем распознавания лиц [5\ме96, 5ме99], что обеспечивает 
высокие показатели распознавания как с очень большими базами 
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Рис. 2.3.5. Кластеризация признаков по методу РСА + ГРА 
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данных (распознавание, поиск близких образов в базах), ыы и тм 
строения систем распознавания лиц для ограниченного числа 
классов и очень малого числа образов в классах. | 
Максимальное число признаков после двухэтаповой процеду- 
ры редукции не может быть больше (Е -— 1), где Е — число клас- 
сов. Такое существенное сокращение размерности пространства 
признаков при сохранении главных характеристик в описании 
каждого отдельного образа (базы данных или нового) создает не- 
обходимые и достаточные условия для использования простых 
механизмов сопоставления образов в процессе их распознавания. 


2.3.4. ОТБОР ПРИЗНАКОВ 
ПРИ РАСПОЗНАВАНИИ ЛИЦ 


В настоящем разделе будут рассмотрены категории признаков 
и способы их выделения в задачах распознавания лиц, построение 
исходного признакового пространства и практические способы его 
редукции, описанные в технической литературе по проблеме «Гасе 
Весогп1Яоп». 

Категории признаков. Как отмечено в [Тоц74], выбор и выделе- 
ние признаков играют в распознавании образов центральную роль. 
В [Тоц74] определены три категории признаков: физические, струк- 
турные и математические. 

В приложении к задачам распознавания людей по лицам, физи- 
ческие и структурные признаки образов лиц выражаются через 
формы лица (овал лица, геометрия его основных частей) и цвет 
лица, волос ит. д. При этом наиболее часто используемый признак 
этих категорий — яркость, выраженный через значение каждого 
пикселя на образе лица. Темные и ясные контрасты определяют 
границы овала лица на общем фоне исходного изображения, грани- 
цы начала и окончания волосяного покрова на голове, границы и 
местоположение основных частей лица (глаз, носа, бровей, рта, ушей 
ит. д.). К категории физических и структурных признаков можно 
также СЫ координаты точек лица в местах, соответствующих 
смене контраста и являющихся таким 
глаза, нос, уши, рот и овал [Тап97]. А, как прови, 

К категории математических п 
исходных образов (например, в баз 
ных функций, функций Адамара, Х 
ний), статистические характеристи 
ния яркости и другие, полученные 
преобразования исходных образов. 

Способы выделения признаков. 
признаков тесно связаны не только с 
и со способом представления исход: 
ства и способом его редукции. 


ризнаков относятся спектры 
е дискретных экспоненциаль- 
аара или вейвлет-преобразова- 
Ки образов, градиенты измене- 
в результате математического 
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ного признакового простран- 





52 











Яркостные признаки «собирают» в вектор признаков путем 
конкатенации столбцов (или строк) исходного изображения лица, 
представляемого матрицей данных. Однако при размерах исход- 
ного изображения М хМ№ пикселей, вектор признаков содержит 
ММ компонент, а матрица ковариации имеет порядок ММ. На- 
пример, при значениях М = 112 и М=92 этот порядок составит 
величину 10304. Гарантированное нахождение собственных чи- 
сел и соответствующих им собственных векторов становится в 
таком случае практически невозможным. Поэтому в практике 
распознавания лиц с использованием яркостных признаков пе- 
ред выполнением конкатенации исходный образ лица перемасш- 
табируют к существенно меньшему размеру. 

Оригинальный метод представления исходного постранства 
признаков изложен в [Тза98]. Здесь исходный образ лица рас- 
сматривается как набор столбцов и строк, являющихся самостоя- 
тельными векторами признаков. Далее процедура РСА применя- 
ется дважды: отдельно для столбцов и отдельно для строк каждого 
образа. В результате редукции исходного пространства призна- 
ков получается матрица, имеющая существенно меньший порядок, 
чем порядок матрицы исходного образа. 

Как отмечено в [Тза98], такой подход упрощает использование 
процедур РСА и повышает точность вычисления собственных чисел 
и векторов, поскольку порядки матриц ковариаций равны разме- 
рам изображения лица. И, кроме того, предложенный способ от- 
бора и редукции признаков делает систему распознавания более 
устойчивой к изменениям яркости исходных образов, а также к 
циклическому сдвигу собственно лица в поле исходного изобра- 
жения, и к шумам, наложенным на исходный образ. 

В [Тза98] кроме оценок вычислительной сложности предло- 
женного подхода приведены также оценки качества распознава- 
ния лиц. Показано, что по сравнению с традиционным подходом 
(сначала перемасштабирование исходного образа, затем конкате- 
нация, далее процедура редукции на основе РСА и ПКЛ) предла- 
гаемый подход дает более высокий процент правильного распо- 
знавания. Распознавание образов базы [Ог!**] доходило до 85 %. 

Для достижения еще большей редукции исходного признако- 
вого пространства и улучшения кластеризации, и, как следствие, 
улучшения качества распознавания, можно воспользоваться под- 
ходом, представленным в [3\е99], т.е. по окончанию редукции 
признаков в соответствии с методом РСА выполнить линейный 
дискриминантный анализ. Как отмечают авторы работы [3ме99], 
при поиске образов в больших базах данных результат доходил 
до 100 %. Эти идеи апробированы в [Кис99Ъ, Кис00с,е] и обеспе- 
чили очень высокий результат распознавания. 

В гл. 5 при синтезе системы распознавания/поиска образов в ба- 
зах данных и в гл. 6 при синтезе систем распознавания «оп-Ппе» 

мы подробно рассмотрим способ отбора и редукции признаков [Тза98], 
соединив его с линейным дискриминантным анализом по [5\уе99]. 
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В категории математических признаков интерес представляют 
спектральные, например, признаки, полученные как результат пре- 
образования Фурье исходного образа. Процесс их выделения со. 
стоит в следующем: выполняется двухмерное дискретное преоб. 
разование Фурье исходного изображения лица; вычисляется аб- 
солютное значения полученного спектра; далее выполняется 
циклический сдвиг (на половину размера исходного изображе- 
ния) спектра по двум осям. Во-первых, такой спектр становится 
инвариантом циклического сдвига образа (циклического сдвига 
лица на фоне его окружения), а во-вторых, симметричным (по- 
скольку исходные данные принадлежат к данным действитель- 
ного типа) и, следовательно, размер признакового пространства 

может быть сокращен вдвое. Кроме того, как показывают иссле- 
дования, полная информация об образе лица содержится всего 
в 20 пространственных частотах. Таким образом, размер исходно- 
го пространства признаков для каждого образа может составить 
максимально (20: 20)/2 =200 элементов. Однако наш собствен- 
ный опыт использования этих признаков показывает [Кис98, 
Кис99], что достижение высокого качества распознавания лиц 
возможно лишь при реализации в системе распознавания подхо- 
дов, связанных с так называемыми локальными РСА. В отличие 
от «глобального РСА», в методе локального РСА анализ главных 
компонент и ПКЛ выполняется не для всей совокупности исход- 
ных данных как единого целого, а для каждого #-го класса исход- 
ных данных отдельно, где к =1,2,..., К. Иными словами, в этом 
методе выполняется К процедур РСА, где К — число классов об- 
разов в исходных данных. Распознавание каждого нового образа 
выполняется также К раз и заканчивается поиском, например 
минимума расстояния из К вычисленных тои ть, 
зование метода локальных РСА подробно опи ) 
в [Ми198]. сано, например, 
Рассмотрим еще один 

а и ая я спектральных 

от пространства исходных спектральных я также переход 

ству инвариантов Фурье—Меллина, ВЕ Чоостран- 


элимини 
заменяющих поворот в плоскости ХУ на цик их о и 
и сдвиг. Пе- 


реход реализуется преобразованием 
спектра м 
го изображения) из декартовой системы Оо [сходно- 
гарифмическую [СВе94, Веп98] или п ых п рно-ло- 
етрическую си- 


олярно- 
стему координат [Кис97а, Клс98а,с]. Проблемой 
остается высокая размерность исходного прост цозрежнему здесь 
соответствующая размерам исходных  изобрадваы нства признаков, 
преобразование Фурье—Меллина несколько уе ии, и, кроме того, 
числительный процесс в задачах распознавания [Кое пов: вы. 
Кух99с]. Для сокращения пространства признак ОСЭВЬ, Кух9эъ, 
ется только половина исходного спектра, из кото: т рассматрива- 
ся ограниченное число пространственных часто Рого использует- 
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Рис. 2.3.6. Маски для отбора признаков из образов 
лиц по методу [@оц96] 


Другой пример из категории математических признаков при- 
веден в [Соц96]. Здесь предлагается 25 масок (размеров 3х3, 5х5 
пикселей ит. д.), с помощью которых вычисляется 25-компонент- 
ный вектор признаков для каждого исходного изображения. Вид 
25 масок размером 3Х 3 пикселя представлен на рис. 2.3.6. При- 
знаки вычисляются путем сканирования образа поочередно каж- 
дой маской (аналогично методам локальной обработки изобра- 
жений [Прэ82]), а кластеризация признаков реализована на осно- 
ве метода ГОА. 

Результаты, представленные в [Сои96], свидетельствуют о вы- 
соком качестве распознавания лиц в системе «оп-Ппе», однако 
для этого требуется большая база лиц для синтеза системы рас- 
познавания (от 50 до 100 образов на класс и не менее 100 классов) 
и учет специфических требований к самим образам. В числе по- 
следних — определенный тип лица и определенный размер соб- 
ственно лица в поле изображения, черный фон, на котором нахо- 
дится портрет, распознаваемый человек должен быть одет в оди- 


наковую одежду и др. 


2.3.5. АНАЛИЗ ЛОКАЛЬНЫХ ПРИЗНАКОВ 


Остановимся еще на одном подходе — распознавании, базиру- 
ющемся на анализе локальных признаков лица [Реп00]. 
В данном подходе на исходном изображении локализуются 


Области, соответствующие, во-первых, лицу и далее на каждом 
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лице — области рта, глаз, носа, бровей, щек и т. д. Подход иллю- 
стрируют рис. 2.3.7 - 2.3.9. 

Нарис. 2.3.7 в левой колонке представлены: полутоновое изоб- 
ражение Иа, его поле градиентов и контуры лица, полученные 
фильтрацией (или пороговой обработкой) поля градиентов. В пра- 
вой части рисунка показано поле градиентов в форме ЗЮ, на кото- 
ром отчетливо видно, что максимумы градиентов очерчивают и 
траницы области лица и границы отдельных его частей. 

Весь процесс получения локальных признаков демонстрирует 
рисунок 2.3.8. 

На поле 4 видны два больших темных пятна и два маленьких 
(точечных) пятна, находящихся ниже правого большого пятна. 
Все эти пятна определяют локальные признаки исходного изоб- 
ражения. В данном случае большие пятна представляют коорди- 
наты х1, У1 И Хо, У2 центров лиц исходного изображения. 

На рис. 2.3.9 (с левой стороны) представлено поле 4 в форме ЗО, 
показывающее, что максимумы, соответствующие центрам лиц, до- 
вольно хорошо локализованы и определение их не вызовет затруд- 
нений. 

Теперь рассмотрим точечные пятна на поле 4. С правой сторо- 
ны рис. 2.3.9 представлены еще два изображения. На одном из 
них показана увеличенная область правого локального признака 
поля 4. И на ней уже очень отчетливо видны еще два точечных 












































Рис. 2.3.8 Иллюстрация к методу анализа локальных признаков: 


блок вычисления градиентов яркости; 2 — поле, представ- 
ов яркости и накопления информации о центрах лиц; реа 
я 2; 4 — результат пороговой обработки поля 3 


1 — исходное изображение; БВГ — 
ляющее результат анализа градиент. 
результат фильтрации пол 
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Рис. 2.3.9. Локальные признаки центров лиц в форме ЗП (слева) и локальные при- 
знаки координат уголков рта 


локальных признака, соответствующие, скорее всего, координатам 
уголков рта на правом изображении (по отношению к исходно- 
му) лица. Другие локальные признаки (например, 
вей) также просматриваются на поле 2. В целом ж 


ные локальные признаки легко обнаружить, применяя описан- 
ные подходы непосредственно к изображению самого лица. 

Координаты локальных признаков и вычисленные расстояния 
между ними позволяют описать лицо с помощью его антропомет- 
рических точек и параметров, которые будут использованы далее 
при распознавании. 

Более поробно весь процесс б 
суждается проблема выделения 


от глаз и бро- 
е и все осталь- 


Удет представлен в гл. 4, где об- 
лиц на изображениях сцен. 


2.3.6. ИСПОЛЬЗОВАНИЕ ЭЛАСТИЧНЫХ МОДЕЛЕЙ 
ФОРМ ЛИЦА 


Некоторые методы решения задачи распознавания лиц исполь- 
зуют понятия «эластичных моделей лица» (англ. ЕехЫе Моае!)), 
которые, в свою очередь, являются объектами, реконструирован- 
ными на основе главных компонент. Ниже будет проанализиро- 
ван один из подходов к синтезу эластичных моделей формы лица, 
а также приложение этих моделей в задачах распознавания. 

Эластичные модели формы лица. Идея подхода изложена в 
[ап97]. В качестве исходных данных были выбраны 160 образов 
лиц (по 8 образов для 20 классов), в каждом из которых выделе- 
ны «вручную» 152 точки. 

Образы лиц из базы данных, заданные полутоновыми изобра- 
жениями в декартовой системе координат, представляются в со- 
ответствии с методикой [Тап97] набором точек с координатами 
по оси Х и У. Пример аналогичного П.ап97] выбора 152 точек 
приведен на рис. 2.3.10 с левой стороны. 

Точки выбираются из нижней 2/3 каждого образа лица в мес- 
тах, соответствующих смене контраста (яркост 


и) и являющихся 
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Рис. 2.3.10. Расположение точек исходной модели формы лица и формы лиц 
из [Тап97] 


такими частями лиц, как брови, глаза, нос, уши, рот и овал лица. 
Эти наборы точек — первоначальные признаки — представляют 
собой исходные модели формы лица (МФЛ). Получаемые при этом 
исходные МФЛ представлены на рис. 2.3.10 с правой стороны. 

Схема вычисления совокупных параметров для каждого ново- 
го образа представлена на рис. 2.3.11. В нижней части рисунка 
выделены сферы приложений эластичных моделей формы лица 
(ЭМФЛ). 

Далее первоначальные признаки редуцируются но методу РСА 
и на их основе реконструируется усредненная МФЛ. При этом 
создается возможность изменения формы модели лица (ее «элас- 
тичного« растяжения/видоизменения и превращения в эластич- 
ную модель формы лица — ЭМФЛ) за счет изменения параметров 
(в пределах + 36) в пространстве редуцированных признаков. Со- 
вокупность ЭМФЛ, соответствующая, например, изменению значе- 
ний первых шести признаков, представлена на рис. 2:32. 

В процессе распознавания ЭМФЛ как бы «натягивается» на 
распознаваемый образ лица, а полученные при этом новые пара- 
метры формы модели являются ключом для классификации/иден- 
тификации распознаваемого образа. 

Дополнительными средствами верификации в задаче распо- 
знавания и параметрами в задаче регистрации распознаваемых 
образов являются профили уровней яркости образов в узловых 
точках ЭМФЛ. 

В [Тап97] обсуждается также решение задачи реконструкции 
образов и построения виртуальных образов лиц. Для ее решения 
используется процедура деформации заданного образа (с учетом 
параметров, определенных по ЭМФЛ) с целью приведения его к 
такому положению, когда лицо повернуто строго в фас. 
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Рис. 2.3.11. Схема вычисления параметров ЭМФЛ из [ап97] 


Далее из деформированного образа выделяется нижняя часть 
лица, которая затем представляется моделью изменения уровней 
в шкале полутоновых изображений. При этом набор параметров 
модели описывает условия освещенности лица, дает определен- 
ную информацию о наличии бороды и усов, а также о выражении 
лица. Такая модель служит основой для распознавания и иденти- 
фикации заданного образа в классе образов, независящих от пара- 
метров ЭФМЛ, и является основой для синтеза нового (вирт он 
го) образа лица. При этом можно «Удалить» очки = тя гие 
объекты, заслоняющие лицо, изменить выражение на се 
су) ит. д. лице (грима- 

Комбинируя все три возможности, 
верждают, что достигли уровня 86 % 
97 % классификации на тестах из 100 
образов соответственно (по 10 образо 
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авторы работы П.ап97] ут- 
› ав некоторых случаях и 
новых образов и 300 новых 
в в каждом классе). 
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Рис. 2.3.12. Влияние изменения параметров призна- 
ков на ЭМФЛ [Гап97] 

















Также в [Тап97] представлены результаты регистрации поло- 
жения лица (головы в пространстве 3) с точностью от 77 до 100 % 
и выражений на лице (включая агрессивность, нейтральность, ра- 
дость, удивление, грусть, испуг ит. д. ) с точностью до 83 %. 


2.3.7. КОММЕРЧЕСКИЕ СИСТЕМЫ 


Среди коммерческих продуктов можно выделить системы рас- 
познавания лиц, разработанные в компаниях У\1з1отсе, УПзазе, М1тгоз, 
11а] Сошшип1сайоп Зузешз А@, информацию о которых 
можно найти на сайте [В1о**] или на сайтах этих компаний: 
угу .Ёасе$.сотш, м\мум.УЙзазе.сот, муу/\.1тоз.сот, уму .Б1014.сота. 

Компания «У11юотщс» предлагает свою систему «Еасе!», распо- 
знавание в которой реализовано на алгоритмах анализа локаль- 
ных признаков. При этом главные из них — координаты цент- 
ров глаз, относительно которых затем вычисляются и другие пара- 
метры лица, в том числе масштабный коэффициент, по которому 
нормируется изображение лица для приведения его к некоторой 
канонической форме. 

В целом методы распознавания, использованные в системе 
«Еасе{» , аналогичны тем, что были представлены выше. По оцен- 
кам разработчиков, система «Расе» может иметь широкое при- 
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менение, поскольку фиксирует лицо человека на значительном 
расстоянии от камеры и при приближении к ней, поддерживает 
поиск в базах данных. Известно применение системы «Расе» 
для идентификации преступников по видеоданным, получаемым 
со 144 камер, установленных в центре Лондона. Применение сис- 
темы возможно также в аэропортах и на станциях метрополите- 
на, в школах, казино, на входе в производственные комплексы, 
фабрики и резиденции, а также в других местах перемещения и 
скопления людей. 

Компания «Ивзаве» предлагает систему «РвофоБооК», в которой 
использованы методы, основанные на «собственных лицах» 
(Е1сеп{асе) и реконструкции образов на их основе. Иными сло- 
вами, здесь реализованы алгоритмы сравнения каждого нового 
образа с эталоном в редуцированном пространстве признаков, а 
редукция выполнена с использованием РСА. Эти алгоритмы так- 
же были обсуждены нами выше. Система «РнофофооК» ориенти- 
рована на поиск образов лиц (близких заданному) в больших ба- 
зах данных, для целей упорядочивания данных в базах и исполь- 
зования в системах аутентификации человека на основе образа 
лица с камеры и фотографии с какого-либо документа. 

Компания «М1тоз» предлагает свою систему «ТгиеГасе», рас- 
познавание в которой реализовано на нейронных сетях, а общая 
идея обработки состоит в выделении неизменяемых частей лица 
и их распознавании при игнорировании остальных его деталей. 
Демонстрационная версия системы «ТгиеРасе» доступна через Ин- 
тернет. Экспресс-результат ее тестирования представлен ниже. 

Демонстрационная версия системы «ТгиеКасе» не требует ка- 
ких-либо специальных и серьезных настроек, проста в эксплуата- 
ции и показала высокое качество распознавания пользователей 
как в режиме аутентификации, так и идентификации. Обучение 
системы (учитывая то, что она построена на нейронной сети) воз- 
можно в момент регистрации пользователя и длится не более 10 се- 
ть Данная версия распознает более 20 пользователей. 

емонстрационная версия системы 
влет р т «ТгиеРасе» имеет следую- 

® настройка параметров системы; 

® регистрация пользователей (до 22 человек); 

® нь пользователя системы (реализ 
соответствия изображения лица, полученног 
образу лица среди жены те ны зон 

® идентификация нового лица (реализуется проверкой 
ветствия нового изображения лица, полученного с иена й соот- 
из лиц базы данных, записанной в память); ному 

® работа с базой пользователей и т. д. 

Информация о пользователях (3—4 сни 
можным изменением масштаба) хранится а ь ео 


м е дан 

цветных изображений. В режиме верификации отв 
дос- 
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тупно только одно изображение 


При этом выбор — это только обозначение того пользователя, с 


которым будет выполняться верификация. Идентификация (или 
верификация) осуществляется автоматически сразу же после за- 
пуска соответствующего режима и включает: захват изображе- 
ния лица; слежение за его движением; печатание под распознава- 
емым изображением специального табло с именем распознанно- 
го пользователя, если распознавание прошло успешно. 

Простые попытки обмана системы (замена «живого» лица чер- 
но-белой фотографией, например) не увенчались успехом. Лож- 
ная акцептация не выступила ни разу даже при средних значени- 
ях порогов акцептации (принятия решений). Ложный отказ на- 
ступал в режиме верификации в случаях «маскировки» лица 
очками, кепкой ит. д. и если в базе пользователь был зарегистри- 
рован без аналогичных аттрибутов. Результат распознавания в 
обоих режимах не был успешным, если существенно изменялось 
освещение или фон/тектура сцены по сравнению с теми условия- 
ми, которые были в момент регистрации пользователя. 

Компания РС$ АС представила систему «Во» — мультимо- 
дальную биометрическую систему идентификации. Система реа- 
лизует свою задачу на основе трех характеристик человека: изоб- 
ражения лица, голоса и движения губ [Етг100]. Именно использо- 
вание последней характеристики (совместно с соответствующим 
динамическим эталоном) обеспечивает высокую степень защиты 
системы «В1оГ)» от обмана с помощью муляжа или фотографии 
лица. В проспекте системы «В1о)» упоминается даже о тройной 
защите (!?). Совместное же использование трех биометрических 
характеристик обеспечивает высокую точность распознавания. 

«В1о[.» рассчитана на использование в системах контроля досту- 
па к компьютерным сетям непосредственно на рабочих местах 
или через терминалы удаленных пользователей. Алгоритмы, 6 
помощью которых решается задача распознавания лиц в «В10оШ», 
основаны на моделях лиц, их антропометрических характеристи- 
ках и сравнении с эталоном из базы данных. На каждого зареги- 
стрированного пользователя в базе данных системы можно иметь 
до восьми образов-эталонов. Система начинает работать с после- 
довательностью видеоданных и переходит в активный режим с 
момента распознавания открытых глаз на одном из первых изоб- 
ражений лица. Далее происходит захват изображений лиц, их пред- 
обработка (в том числе нормализация шкалы и поворотов) и орто- 
гонализация. После чего для каждого выделенного таким обра- 
зом лица формируется вектор признаков, который сравнивается 
со всеми эталонами каждого класса. 

А теперь обратим внимание на точность автоматического рас- 
познавания лиц. 

Напомним, что изменение освещения и изменение положения 
головы перед камерой, смена камеры, а также существенная раз- 
ница во времени при получении каждого нового изображения 


лица конкретного пользователя. 
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значительно влияют на качество разпознавания. Из [Реп00] сле- 
дует, «что для фронтальных изображений лиц, сделанных в один 
и тот же день, приемлемая точность распознавания составляет, 
как правило, 95 %. Для изображений лиц, сделанных разными 
камерами, и при относительно разном освещении, точность рас- 
познавания снижается до 90 %. Для изображений лиц, сделан- 
ных с разницей в год, точность распознавания составляет пример- 
но 50 % ›. При этом следует отметить, что в перечисленных вари- 
антах получения изображений лиц показатель качества распозна- 
вания ЕКАВ практически оставался неизменным (на уровне 2 %), 
в то время как ЕВВ, изменяется от 0,4 до 43 % [Реп00]. 


Из этого, в частности, следует, что, представляя качественные 
характеристики систем распознавания лиц, необходимо также 
соблюдать и те условия, при которых получены соответствующие 
показатели качества. И только под таким углом зрения оцени- 


вать официально публикуемые данные о точности (качестве) рас- 
познавания каждой системы. 


В заключение раздела приведем два новых примера использо- 
вания коммерческих систем распознавания лиц. 

Для начала отметим случай практического применения сис- 
тем распознавания лиц в следственной практике, представлен- 
ный на сайтах [В1о**]. 

Итак, некий шериф из Лос-Анджелеса (США) разыскивал пре- 
ступника по фотороботу и для этого использовал систему распо- 
знавания лиц «КасеО» компании «/[таве"ате». Именно благо- 
даря этой системе, он довольно быстро нашел фотографию челове- 
ка, подозреваемого в преступлении. Информация об этом случае, 
представленная на сайте, сопровождалась двумя портретами — на 
одном из них был представлен фоторобот подозреваемого в пре- 
ступлении, а на другом — фотография человека, якобы найденно- 
го в базе данных системы «Еасе». 

На рис. 2.3.18 представлены эти два портрета: 1 — фоторобот, а 
2 — лицо из базы данных системы «Еасе». Действительно ли 
эти лица принадлежат одному и тому же человеку, невозможно ни 
подтвердить, ни опровергнуть. Но то, что система «Еасе)» выпол 
нила свою функцию: нашла близкий фотороботу образ (и, во : 
но, при ограниченной базе данных преступников) — это фа. в: 

Задолго до начала Олимпийских игр 2000 г., в аэропо д 
берры и Брисбена (Австралия) прошла испытания о а 
портного контроля компании СРВ. При успехе подобные мы 
предполагалось установить в международных аэропортах и > 
ских портах по всей Австралии на период проведения Иг 2000. 
Система паспортного контроля решала две основные нех . 
водила сравнение фотографии на паспорте с изображением 2 
получаемым камерой, и установление меры подобия между Ее, 
проверку данных предъявленного паспорта мах 


по информа: И 
сети Интерпола. Если устанавливалась высок о тиолной 
на фотографии паспорта с лицом на изобра 
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Рис. 2.3.13. Результат поиска образа, подобного заданному фотороботу 


линии Интерпола не возникало никаких проблем, то владелец пас- 
порта мог пересекать границу. 

Решая одну из наиболее сложных задач распознавания лю- 
дей — сравнение лица на фотографии (возможно, очень давней) 
с изображением лица, получаемым камерой в момент контроля, 
система контроля затрачивала на проверку каждого паспорта не 
более 10 секунд. Сложность этой задачи заключается в том, что 
между двумя сравниваемыми изображениями всегда была неко- 
торая разница во времени их получения и, возможно, очень суще- 
ственная разница в условиях их получения. 


2.3.8. НЕСКОЛЬКО СЛОВ О БУДУЩЕМ 


Кроме перечисленных выше приложений систем рассматри- 
ваемого класса, главное назначение которых — это идентифика- 
ция человека по его лицу, обратим внимание на два новых прило- 
жения, наиболее интересных для будущего медицины, индустрии 
развлечений и организации коллективных работ. 

Во-первых, это приложения, связанные с физиогномикой, в том 
числе с оценкой физического, психического, эмоционального и 
интеллектуального состояния человека. В литературе, посвящен- 
ной этим проблемам, описано множество общих и локальных при- 
знаков лица, а также методик его анализа, позволяющих досто- 
верно оценить эти состояния [Теп95, Вел98, Гон97]. В базах дан- 
ных таких систем (в отличие от описанных выше) должны 
содержаться специальные информационные комплексы, представ- 
ляющие в качестве эталонов анатомические характеристики лица 
и его типологию, другие информационные знаки лица и методики 
оценки по ним состояний человека. 
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Во-вторых, это приложения, связанные с интерпретацией дей- 
ствий человека — его намерений и поведения в отношении окру- 
жающих его людей [Реп00]. Для реализации таких приложений 
в базах данных соответствующих систем должны содержаться 
эталоны лиц (особенно области бровей и глаз, области рта), опре- 
деляющих различные эмоциональные состояния человека: нейт- 
ральность, радость, удивление, грусть, испуг, агрессивность ит. д. 
Попытки распознавания подобных эмоциональных состояний че- 
ловека можно найти, например, в [Т.ап97, Езз97, Ооп99]. 

Отдельно можно выделить перспективные системы распозна- 
вания лиц, связанные с так называемыми носимыми системами 
распознавания, т.е. функционирующими на базе носимых компью- 
теров, миниатюрных видеокамер и мониторов, встроенных в очки. 
Основная функция таких систем — распознавание в режиме «оп- 
Цле» знакомых лиц среди собеседников, прохожих на улице, со- 
трудников (в больших фирмах) или сослуживцев (например, в ар- 
мии), случайно или специально попавших в поле зрения. Приме- 
ры таких систем с подробным представлением их функций уже 
можно найти в [Реп00]. 

Идентификация человека на основе термограммы лица. Все 
представленные выше системы используют биометрические ха- 
рактеристики лица, полученные из его двухмерного представле- 
ния. Системы эти просты в эксплуатации, практически не требу- 
ют специального оборудования (использование видеокамер, как 
правило камер для видеоконференций, сегодня не проблема, по- 
скольку они входят в комплект мультимедийных средств компью- 
тера), обладают высоким быстродействием. Однако эти системы 
не защищены от несанкционированного доступа, поскольку могут 
быть «обмануты» плоскими изображениями лиц оригиналов (или 
фотомуляжей). 

Несанкционированный доступ к системе идентификации че- 
ловека по лицу становится практически невозможным, 
сто видеообраза использовать термографический образ 
формационными признаками такого образа являются п 
рисунки артерии и вен, повторить кото 
тически невозможно. Термограмма лица — уникальная характе- 
ристика человека. Для получения исходного термографического 
образа используются специальные камеры, улавливающие инф- 
ракрасное излучение от лица человека. Камеры могут работать в 
полной темноте, а информационные признаки не зависят ни от 
температуры самого лица, ни от выполненных пластических опе- 
раций, ни от естественного старения человека. Инфракрасная ка- 
мера дает приемлемый для практических приложений термогра- 


фический образ лица даже в случае, когда человек находится на 
значительном удалении от камеры. 


Следует, однако, отметить, что цена таких камер значительно 


выше цены (на один-два порядка) камер ССЬ, используемых для 
получения видеообразов. 


если вме- 
лица. Ин- 
одкожные 
рые в форме муляжа прак- 
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Очевидно, что системы идентификации, использующие термо- 
графический образ лица, могут широко использоваться в систе- 
мах контроля доступа с высокой степенью ответственности и на- 
дежности. Подобные системы «обеспечивают близкую к 100 % 
точность распознавания независимо от использования специаль- 
ных масок или даже проведения пластических операций, так как 
термограмма — это схема расположения внутренних кровенос- 
ных сосудов. Исследования показали, что даже однояйцевые близ- 
нецы имеют свои уникальные термограммы» [Евс97]. 

Однако, как и в случае использования технологии видеоизоб- 
ражений лиц, здесь существует проблема, связанная с положени- 
ем лица перед камерой. Для получения рисунка артерий и вен, 
соответствующих положению лица в фас (или, например, эталону), 
лицо должно «смотреть» строго в камеру. 

Поддерживает разработки по проблеме идентификации чело- 











В ОЧки 
КИ, 
Ме «01. 





О, Вар. века на основе термограммы лица фирма «Тесрпо]осу Весоби! оп 
Приме. Зузбетз» (США). 
ий уже 
ца, Все 2.4. ТЕХНОЛОГИЯ, 
:ие Ха- ИСПОЛЬЗУЮЩАЯ РАСПОЗНАВАНИЕ 
вы ПО РАДУЖНОЙ ОБОЛОЧКЕ ГЛАЗА 
пре Радужная оболочка глаза является уникальной для каждого 
р, как человека биометрической характеристикой. Она формируется в 
а, по- период до полутора лет жизни человека и остается без изменений 
уМПЬЮ до конца его жизни, если здоровье человека не претерпело каких- 
стемы либо принципиальных изменений. Последние отражаются на ра- 
‚ могу? дужной оболочке в виде изменения ее цвета, появления на ней 
в (или новых пигментных пятен, линий и кругов, изменений обвода обо- 
лочки, деформации зрачка и т. д. Эти особенности используются 
ии при иридоанализе для диагностики заболеваний или выявления 
3ме" предрасположенности к некоторым заболеваниям [Вел88, Вел98]. 
и Пн" В биометрических системах идентификации человека использу- 
8, 15 ется полутоновое изображение радужной оболочки, в котором 
ге некоторые пигментные изменения не так заметны. 
т, Методы идентификации человека по радужной оболочке гла- 
р за. К настоящему моменту в системах идентификации человека 
ско я по радужной оболочке сформировались два основных подхода, от- 
Е 80 личающиеся друг от друга способами представления образов ра- 
188 7 дужки и соответствующих им образов-эталонов. 
и г В первом подходе радужка (как новый образ или эталон) не- 
$ 0” посредственно выделяется из изображения глаза [Вог97, №197], а 
й. ка во втором — этим образом является матрица штрих-кодов, соот- 
и ветствующая структуре поверхности радужной оболочки [50197, 
у 


и. №00]. 
В свою очередь, радужки в первом подходе могут быть пред- 
„и ставлены в двух формах: 
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® колец, выделенных из изображения глаза и определяющих 
только ту часть информационных знаков глаза, которая непосред- 
ственно относится к радужной оболочке [\/197]; 

® прямоугольника, полученного из кольца радужной оболочки 
путем преобразования декартовой системы координат в поляр- 
ную [Вог9Т, Кис97Та, Кис98с]. 

Процесс получения кольца радужной оболочки непосредствен- 
но из изображения глаза показан на рис. 2.4.1. 

Как видно из рис. 2.4.1, сначала на области зрачка определяет- 
ся его центр (изображение 2), относительно которого определяют- 
ся два радиуса: г и Е. При этом г определяет радиус зрачка, аВ — 
радиус до внешнего края радужной оболочки. Процесс определе- 
ния значенийг и В выполняется автоматически на основе порого- 
вой обработки (сечений) и процедур вычисления контура. Полу- 
ченные при этом кривые, определяющие контурные границы зрач- 
ка и границы радужки, не являются совсем точными и круглыми. 
Далее эти границы определяются более точно, таким образом оп- |. 
ределяется кольцо радужной оболочки. Заканчивает весь процесс ыы 


процедура улучшения качества изображения кольца радужной 
оболочки (см. изображение 3). 


Результат преобразования коль , 


ца радужной оболочки из де- 
картовой системы координат в полярную форму представлен на 


рис. 2.4.2 [Вог97, Кис9Та, Кис98‹]. Весь процесс развертки радуж- | 
ной оболочки включает: определение местоположения, центра и | 
контуров зрачка, определение величин радиусов окружности зрачка 
и окружности радужной оболочки, формирование координат по- 
лярной системы, и, наконец, преобразование каждого пикселя ра- 




















Рис. 2.4.1. Процесс получения кольца (отмечено цифрой 3) радужной оболочки 
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Рис. 2.4.2. Развертка радужной оболочки глаза в прямоугольную форму [Вог97] 


дужной оболочки из его представления в декартовой системе ко- 
ординат в представление в полярной системе координат. После- 
довательность выполнения описанного процесса и получаемые при 
этом результаты отмечены на рисунке цифрами 1-5. 

Поскольку целочисленные индексы декартовой системы коор- 
динат не всегда строго соответствуют координатам полярной си- 
стемы, на последнем этапе используется процедура интерполя- 
ции (нулевого порядка, двулинейная, или, например, билинейная 
[Кис97а, Клс98с]). 

На рис. 2.4.2 в нижней его части, представляющей развертку 
радужки в прямоугольную форму, по оси Х отложены углы по- 
лярной системы координат, а по оси У — значения радиуса В. 

Вторая форма представления радужных оболочек требует боль- 
ших вычислительных затрат (в сравнении с затратами на пред- 
ставление радужки в форме кольца), однако является более удоб- 
ной для практических применений. 

Это обусловлено следующим: 

® поворот изображения, преобразованного из декартовой систе- 
мы координат в полярную, заменяется его циклическим сдви- 
гом; 

® используя логарифмическое представление координат в на- 
правлении радиуса В (вместо линейного), можно получить инва- 
риант масштабного изменения радужной оболочки (в направле- 

нии радиуса В); ;. 

® используя два отмеченных выше свойства, получаем пред- 
ставление радужной оболочки глаза в форме инварианта поворо- 
та и масштаба, что значительно упрощает его сопоставление с ана- 
логично представленным эталоном. 

В качестве основного метода сравнения двух образов радуж- 
ной оболочки в рассматриваемых случаях используется, как пра- 
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Рис. 2.4.3. Процесс получения матриц штрих-кодов радужной оболочки глаза 


вило, взаимная корреляция. Некоторые результаты такого подхо- 
да представлены в [Вог97], где, в частности показано, что даже при 
значительных различиях в масштабе и повороте в изображениях 
двух одинаковых глаз коэффициент взаимной корреляции не был 
ниже 0,85. 

Процесс получения матриц штрих-кодов, соответствующих 
структуре поверхности радужной оболочки, представлен схемати- 
чески на рис. 2.4.3 [30197, № е500]. Последовательность выполня- 
емых при этом этапов и получаемых результатов преобразования 
исходных данных, отмечена цифрами от 1 до 5. 

Этапы 1 — 3 связаны с выделением области лица на некоторой 
сцене, локализацией глаза на лице и зрачка на области глаза. На 
четвертом этапе выполняемого процесса на радужную оболочку 
глаза (нормированного по масштабу) накладывается фиксирован- 
ная маска полярной системы координат. Значение каждого пик- 
селя радужной оболочки в точке, соответствующей координатам 
маски, сравнивается с некоторым заданным порогом и в зависи- 
мости от результата сравнения записывается как «0» или ‹1» в 
определенное место матрицы штрих-кодов. Эта своеобразная би- 

нарная матрица представлена на рис. 2.4.3 под номером 5. 

Образ-эталон радужной оболочки (радужка зарегистрированного 
пользователя) записывается в память системы как файл размером 
512 байтов. На этапе идентификации очередного клиента я 
(или его аутентификации), сравнение каждой новой матрицы шт мы 
кодов с матрицей-эталоном может быть выполнено любым из = 
ным способом, хотя и здесь возможна взаимная корреляция д ст- 

гой способ сравнения (сопоставления) двух матриц — оценка и. 
стояния между ними, например, в метрике То или О и 


одну позицию (столбец или строку) одной матрицы относительн 
другой может привести к неправильному результату. о 
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Рис. 2.4.4. Некоторые устройства для получения изображений глаз 


Устройства сканирования глаз. На рис. 2.4.4 представлены 
некоторые устройства для получения изображений глаз и выде- 
ления из них образа радужной оболочки. Это автономные устрой- 
ства, содержащие по две-три встроенные видеокамеры. Прибор 
«Апбепсат”М» фирмы «Пап Тесппоотез» предназначен в 
основном для индивидуального пользователя, в то время как при- 
бор «Г$-1518р» (совместное изделие компании «[1Зсап и Га») — 
для коллективного использования. 

Прибор «Аифепсат"”М» подключается к компьютеру через 
порт ОБВ, имеет небольшие габариты, прост в обслуживании и 
может использоваться совместно с компьютерами Мофероок. 

Прибор «1[5-1518р» используется в системе «П1Зсап?’з 
Бузет 2100» идентификации человека, поставляемой компанией 
«П15сап» на рынок биометрических технологий. Как следует из про- 
спекта компании «[ПЗсап» на эту систему, база данных содержит 
4000 эталонов. Регистрация пользователя занимает не более 30 се- 
кунд. Пользователь располагается напротив прибора «[.5-1518р» 
на расстоянии 9 10 дюймов от него. Собственно процесс идентифи- 
кации реализуется за 2 секунды. К, системе «П15сап’5 Бузбет 2100» 
можно подключить более 256 удаленных терминалов с приборами 
«15-1518р», в связи с чем эта система может использоваться для 
контроля доступа к распределенным информационным системам 
и базам данных. Более подробную информацию о системе можно 
найти на сайте у\ум\.п71зсап.сот. 

Компания «ЕуеТ1сКеф Согрогайоп» (у\\\.еуейсКе$.сот) при- 
вела на своем сайте пример использования собственных сканеров 
радужной оболочки глаза в системе контроля доступа ЕуеТ1сКефтм 
на входе в Немецкий Дом в Сиднее. 
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Рис. 2.4.5. Сканер, 


турникеты со сканерами и процесс аутентификации 


На рис. 2.4.5 представлен аналогичный пример. Здесь 1 — 
сканер ЕуеТ1скефтм; 2 — турникеты, оснащенные сканерами 


ЕуеТ1сКеё"м, на входе в помещение Немецкого Дома; 3 — процесс 
аутентификации гостя Немецкого Дома. 





3. ЭЛЕМЕНТЫ ЦИФРОВОЙ 
ОБРАБОТКИ ИЗОБРАЖЕНИЙ 


В настоящей главе приведены краткие сведения о методах и 
алгоритмах, используемых при цифровой обработке изображений 


и в приложении к задачам распознавания образов, используемых 
в биометрических технологиях. 


3.1. ФОРМЫ И СПОСОБЫ ПРЕДСТАВЛЕНИЯ 
ЦИФРОВЫХ ИЗОБРАЖЕНИЙ 


Цифровое изображение (ЦИ) появляется в результате дискре- 
тизации по времени и квантования по уровню аналогового двух- 
мерного сигнала. Наименьший элемент ЦИ называется пикселем 
(р1хе). Цифровое изображение представляется в общем случае 
прямоугольной таблицей, имеющей № строк и М столбцов, где 
каждый элемент есть пиксель. Эту таблицу можно также запи- 
сать в виде матрицы размером №МхМ элементов. 

Для графического представления координат пикселей ЦИ ис- 
пользуется несколько различных способов. 

В задачах, ‘связанных с распознаванием образов, одно и то же 
цифровое изображение может быть представлено различными спо- 
собами как в декартовой, так и в полярной системах координат. 

На рис. 3.1.1 приведены два способа представления цифрового 
изображения в декартовой системе координат. 

Левая координатная система соответствует оси Х, идущей еле- 
ва направо, а правая координатная система — оси У, идущей сни- 
зу вверх. Поэтому в левом нижнем углу матрицы, представляю- 
щей ЦИ в левой координатной системе, находится пиксель с коор- 
динатами (1, 1), а в правом верхнем углу — пиксель с координатами 
(№, М). 

В правой координатной системе порядковое перечисление пик- 
селей ЦИ начинается с верхнего левого угла соответствующей 
матрицы и заканчивается в правом нижнем углу. И хотя такое 
представление координат отличается от общепринятого представ- 
ления в двухмерной левосторонней декартовой системе, оно наи- 
более часто используется в отображении цифровых изображений 
на плоскости ХУ. 

Расстояние 4 между двумя пикселями, имеющими координа- 
ты (х1, и) и (хо, у2), определяется следующим образом: 

4,2 = (= _ 2) + (м -и} $ (3.1.1) 
Пусть нам задана матрица 8-го порядка, 
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Рис. 3.1.1. Два способа представления цифрового изображения в декартовой си- 
стеме координат 
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12 18 24 30 36 42 48 
14 21 28 35 42 49 56 
8 16 24 32 40 48 56 64 


| определяющая изображение размером 8х 8 пикселей. 
| В графической форме это же изображение в декартовой систе- 











Рис. 3.1.2. Матрица (3.2), представленная как цифровое изображение 
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Рис. 3.1.3. Матрица (3.2), представленная в форме ЗР образа 


тов откладываются по оси Й. Результат такого представления 
показывает рис. 3.1.3. 

На рис. 3.1.3 буквой а определено изображение (3.1.2) в лево- 
сторонней трехмерной декартовой системе координат, а буквой 
ЪЬ — то же изображение в правосторонней трехмерной декартовой 
системе координат. 

По терминологии [Пав86] изображения, представленные в форме 
ЗО, относятся к цифровым изображениям класса «0». Чтобы не 
путать понятие «класс из [Пав86]» с общепринятым понятием 
класса, используемым в распознавании образов, заменим первое 
термином способ. И теперь отметим, что в [Пав86] введено 
пять способов описания и представления цифровых изображений, 
из которых способы 1 - 4 предназначены для представления изоб- 
ражений в форме 2). Последние разделены на: полутоновые би- 
нарные, контурные и изображения, представленные отдельными 
точками или своими локальными областями. 

Пример графического представления одного и того же изобра- 
жения (участка лица) в форме ЗО и 20 приведен на рис. 3.1.4. 
Форма 2) представлена полутоновым и контурным изображения- 
ми, а также изображением с локальными областями лица. Над 
каждым из изображений указан способ его представления (класс 
по [Пав86], которому принадлежит изображение). 

Благодаря введенной в [Пав86] классификации можно описы- 
вать соотношения между изображениями на входе и выходе сис- 
тем обработки изображений. Так, например, вертикальная проек- 
ция ЗО-изображения на плоскость ХУ позволяет получить изоб- 
ражение в форме 2, а срезы последнего при различных значениях 
порогов переводят полутоновое 2)-изображение в бинарное. В свою 
очередь, бинарное изображение легко преобразуется в контур при 
помощи какой-либо процедуры контуризации и т. д. Такое нис- 

ходящее преобразование ЦИ часто используется в задачах рас- 
познавания образов при выделении признаков на изображениях. 

Выбор другой (не декартовой) системы координат для графи- 
ческого представления ЦИ определяется конкретной областью при- 
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Рис. 3.1.4. Пять способов представления одного и того же изображения 


ложений и вытекающей из нее спе 
Например, в преобразовании Фурье 
емом при распознавании образов [Ве 
спектр цифрового изображения и 


г а.[.5. 
Координаты пикселей из одной 


системы в другую пересчиты- 
ваются по следующим соотношениям: 


р=\/х2 +у2 Я 8 (в) = 1,20; хе реоз( 


Ф); у=рэш(Ф). (3.1.3) 

















Рис. 3.1.5. Варианты полярной системы координат и размещение пикселей 
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Рис. 3.1.6. Способы размещения полярных координат на цифро- 
вом изображении 


поле ЦИ. Оба эти способа, широко применяемые в практике циф- 
ровой обработки изображений, показаны на рис. 3.1.6. 


3.2. СИСТЕМА ОБОЗНАЧЕНИЙ, 
ИСПОЛЬЗУЕМАЯ В АЛГОРИТМАХ 
ОБРАБОТКИ ИЗОБРАЖЕНИЙ 


Пусть некоторое цифровое изображение записано матрицей 
размером МхМ пикселей. Тогда каждый пиксель этого изобра- 
жения запишем в виде [Прэ82, Даг83, Кис98а, Гол99] 


р(п,т), (321) 


гдеп=1,2,...,Мит=1,2,.... М. 

Все изображение можно записать в форме Рихм или в форме 
Рх (для случая М№М=М). При этом нижний индекс (выражение) в 
обозначении матрицы всегда будет обозначать ее порядок (или 
размер для случая М*М). 

К каждой матрице, определяющей ЦИ, можно применить опе- 
рации транспонирования, обращения, комплексного спряжения, 
возведения в степень и т. д., которые записываются наиболее при- 
нятыми для этих операций обозначениями. Например: 


р [Ру], [Р»]', [Ру]. (3.2.2) 


77 














Для обозначения нулевых и единичных матриц порядков № 
используются следующие обозначения: 


[9] уиГу, при [0], =Оип; =1. (3.2.3) 


Кроме обычного (декартового) произведения матриц, в обсуж- 
даемых ниже процедурах обработки и распознавания ЦИ будут 
использоваться еще два типа произведений: прямое и поточеч- 
ное. 


Прямое (кронекеровское) произведение для матриц Ау и Ву 
записывается следующим образом: 


Аз ® Вы = См), (3.2.4) 


где матрица Сум) имеет порядок ММ. 

Прямое произведение матриц может быть правым и левым. 
При правом прямом произведении двух матриц результат фор- 
мируется блоками так, что вместо каждого элемента левой матри- 
цы записывается результат умножения этого элемента на всю 
правую матрицу. Результирующая мат 


рица С(ум) будет иметь при 
этом следующую структуру: 


а1Вм а1мВм 
О ак: АВА (3.2.5) 
ам1Вм ‘`` аммВы 
Поточечное произведение матриц Ал и Ву записывается в форме 
АмОВу = Су, (3.2.6) 
где матрица Су порядка М№ определяется следующим образом: 
@11611 а м6 
См = (3.2.7) 
ам16 м г @ммбум 


3.3. БАЗОВЫЕ ПРОЦЕДУРЫ ОБРАБОТКИ ИЗОБРАЖЕНИЙ 


Представим некоторые простые (базовые) процедуры, испо льзу- 
емые в задачах обработки цифровых изображений, в том числе 
процедуры сложения, вычитания и умножения цифровых изобра- 
жений, процедуры, основанные на логических операциях (операци- 
ях «или» и сложения по модулю 2). При этом наше 


й целью здесь 
является представление процедур обработки изображений в ВЕ 
18 














2.3} 


торно-матричной форме, которую можно непосредственно исполь- 
зовать при реализации этих базовых процедур, а также других 6б0- 
лее сложных, но основанных на базовых. Некоторые из этих про- 
цедур будут также представлены в языке пакета МАТГАВ [Пот99, 
Руд00], что позволит реализовать их проверку и использование в кон- 
кретных прикладных задачах. 

Сложение двух изображений записывается в форме 


Анм=Рмм + Эмм или Ау=Ру + Оу, если М=М. (3.3.1) 


Сложение нескольких одинаковых изображений используется, 
например, как процедура «когерентного накопления» изображе- 
ний, находящихся под шумом, что значительно улучшает каче- 
ство результирующего изображения. 

Вычитание двух цифровых изображений записывается в форме 


А(им)= Хим) - Укум) или Ан=Ху - Ук, еслиМ=М. (3.3.2) 


Вычитание в форме (3.3.2) используется довольно часто для 
реализации процедур «неострого маскирования», позволяющих 
подготовить изображение для получения очень четких контуров 
объектов, входящих в исходное изображение. 

Умножение поточечное цифровых изображений можно реали- 
зовать следующим образом: 


У, = Хи ОХн0...О Хы, (3.3.3) 


что обычно используется для улучшения качества изображений. 

Заметим, что при выполнении операций (3.3.1) - (3.3.3) необ- 
ходимо следить за значениями (яркости) пикселей, величины ко- 
торых должны находиться в пределах заданного диапазона. На- 
пример, для полутоновых изображений этот диапазон находится 
в пределах от 1 до 255. 

Использование логических операций покажем на примере вы- 
деления контура бинарного изображения. Итак, пусть матрица 
Ху порядка М, представляет бинарное изображение. Два примера 
таких изображений приведены на рис. 3.3.1 под номерами 1 и 3. 
Вычисление контура реализуем но следующей процедуре [Кис98а]: 


[2] [8] у 


Рис. 3.3.1. Результаты вычисления контуров по процедуре (3.3.4) 
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> (2) 
‚9 - (> +». У (% +Ху а , (3.3.4) 


где Х(®) — матрица Хх с циклически сдвинутыми влево (или впра- 
во) на одну позицию столбцами; Х (0) — матрица Ху с циклически 
сдвинутыми вверх (или в низ) на одну позицию строками; К р: 
матрица порядка М, определяющая вычисляемый контур; м, поа 2 — 
знаки операции «или» и сложения по модулю 2. 

Результат вычисления контуров для двух приведенных на 
рис. 3.3.1 изображений представляют два новых изображения — 
2 и 4 соответственно. Из результатов видно, что независимо от 
фона исходных изображений (образ на черном или белом фоне) 
процедура приводит к одному и тому же результату. 

Программа вычисления контура бинарного изображения по про- 
цедуре (3.3.4), написанная в языке пакета МАТГАВ, приведена 
ниже. 

Заметим, что выбор любой пары сдвигов из возможных вари- 
антов (влево + вверх, влево + вниз, вправо + вверх и, наконец, впра- 
во + вниз) приводит к сдвигу границ вычисляемых контуров на 
одну позицию, что является ошибкой метода (3.3.4). Однако в 
рассматриваемых здесь приложениях эта методическая ошибка 


не столь принципиальна. Результат, представленый на рис. 3.3.1, 
получен на основе приведенной программы 1. 


Векторизация. В разд. 2.3 мы отмечали возможность исполь- 
зования для распознавания лиц эластичных моделей форм лица 






Программа 1 
БпсНоп К = Копаи(Х) 







% Вычисление контура бинарного изображения, 
% представленного квадратной матрицей Х 






% Проверка размера матрицы Х 
[тьп] = $12е(Х); 
Шт -= п гешго; епа; 









% Формирование матрицы циклическ 
Т = еуе(т); 
Т= [1(:,2:10) 1С:,1)}]; 


ого сдвига 





% Вычисление контура и запись его в массив К 
К = гет(Х+(Х*Т, 2) | гет((1*Х)+ Х, 2); 
К=- К; 









% Конец процедуры 
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(ЭМФЛ). ЭМФЛ описывает контуры основных деталей лица (овал 
лица, контуры носа, глаз и бровей, контуры губ) в форме вектора, 
содержащего координаты точек контура. При автоматическом 
построении ЭМФЛ неизбежен переход от контура (как бинарного 
образа) к его векторному представлению. Это и есть операция 
векторизации контура. 

Подходов и методов, предназначенных для реализации опера- 
ций векторизации контуров, известно достаточно много (см., на- 
пример, [Пав86, Прэ82, Янш94]). Остановимся лишь на одном, кото- 
рый можно условно назвать «методом поиска ближайшего соседа» 
и который предназначен для случаев, когда бинарное изображение 
состоит из нескольких контуров. Подробно этот метод изложен и 
проиллюстрирован в [Кис98а]. 

Суть метода состоит в следующем. Положим, что пиксели, соот- 
ветствующие элементам контура, имеют значение, равное 1. Пик- 
сели фона при этом имеют значения, равные 0. Находим первый 
«ненулевой» пиксель путем, например, сканирования по строкам 
исходного изображения. Отметим координаты (х„, у») этого пиксе- 
ля как начало первого контура. Далее определим эти координаты 
как центр маски размером 3х3 пикселя и будем просматривать 
все оставшееся пространство в поле маски. Фактически среди восьми 
ближайших к центру маски пикселей отыскиваем такие, которые 
имеют ненулевые значения. В случае обнаружения такового, опре- 
деляем расстояние до него, используя соотношение (3.1.1). По окон- 
чании всего просмотра в поле маски следующим элементом кон- 

тура маски будем считать тот, расстояние до которого окажется 
минимальным. Это и есть «ближайший сосед». Координаты цент- 
ра маски переписываем в результирующий вектор, центр маски 
передвигаем на «найденного соседа» и весь процесс поиска нового 
«ближайшего соседа» повторяется. Найденные элементы контура 
из дальнейшего рассмотрения исключаются, например, «обнулени- 
ем» соответствующих пикселей. Процесс векторизации текущего 
(локального) контура заканчивается тогда, когда последний най- 
денный элемент контура будет соседом пикселя, определенного как 
начало контура. Если в поле рамки 3х3 пикселя не обнаружено 
ни одного «ненулевого» соседа, сторона рамки увеличивается до 5 
(7 или 9 ит. д.) пикселей, вплоть до некоторого порога увеличения 
или до явного замыкания контура. Если при этом просмотр ис- 
ходного изображения не закончен, то снова отыскивается первый 
элемент нового контура, и процесс векторизации продолжается... 

Представим теперь другую задачу, связанную с упорядочивани- 
ем друг за другом (в контур) элементов вектора, состоящего из № 
пар чисел, полученных от генератора случайных чисел. Эта задача 
ассоциируется, например, с упорядочиванием минуций, описываю- 
щих некоторый отпечаток пальца (ее мы обсуждали в разд. 2.1). 

Итак, пусть нам даны М пар случайных чисел, которые будем 
рассматривать как координаты х и у на некоторой плоскости ХУ. 
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Рис. 3.3.2. Получение контура из случайно сгенерированных пар координат 


Это, например, могут быть координаты всех пикселей (отдельного 
контура), значения которых не равны 0. Если соединить между 
собой эти координаты (на плоскости ХУ) в той последовательнос- 
ти, в которой они сгенерированы (или были заданы), то получится 
фигура, подобная той, что показана на рис. 3.3.2 под номером 1. 
Нам же нужно получить фигуру, представленную на рис. 3.3.2 
под номером 2. 

Программа в языке пакета МАТГАВ, реализующая представ- 
ленную задачу, приведена ниже (Программа 2). 

Запишем все исходные координаты в форме вектора Х, состо- 
ящего из М комплексных чисел: 


х = [м +), ( + №»)... (хм + №к)]. (3.3.5) 


С учетом (3.3.5) в программе 2 реализованы следующие дей- 
ствия. 

1. Исходные данные центрированы относительно среднего зна- 
чения: 


Х=хХ-х, (3.3.6) 


где Х — среднее значение вектора Х. 
2. Вычислены полярные углы для всех пар 


центрированных ко- 
ординат: 


9 — аговв (ппав (Хо /теа(Хо)). (3.3.7) 


3. Выполнена сортировка полярных углов по возрастанию и 
запоминается порядок их пересортировки (например, в векторе 
1ш4ех). 

4. Исходные координаты сортируются в соответст: 


вии с возрас- 
танием полярного угла: 


У’ = Хапаех). 


(3.3.8) 





у’ = 











Программа 2 
РапсНоп У’=мекюг(Х) 


% Упорядочивание друг за другом (в контур) ‹.. 
% элементов вектора. 
% Х - вектор неупорядоченных комплексных чисел 


% \\“- вектор упорядоченных друг за другом 
% комплексных чисел 


% Центрирование исходных данных 
1 += за1(-1); х = теа(Х); у = птаз(Х); 
1еп = 1еп2®(х); 
хсепиг = Их(зшт(х)Леп); усепи: = Ях(зита(у)Леп); 
х = х-хсепи; у = у-усепи; 





ду % Вычисление полярных координат 
у [еб го] = саи2ро1(х,у); 

я % Сортировка по полярному углу 
| [алп4ех] = з0ои({е1); 


у Х!1 = х(пдех); У1 = у(шаех); 
к % Формирование результата 

У = Х!+хсепи + ]0{*(У1+усепи); 
% Замыкание контура 

М = М \(1)}; 





% Конец процедуры 





Е 





Развертка контурного изображения. В задачах распознавания 
изображений (например, рукописных знаков, букв, цифр и др.) 
довольно часто используются инварианты аффинных преобразо- 
ваний контурных объектов на плоскости ХУ: поворота, масштаба, 
сдвига [Ваи92, Кис99а]. Представим здесь ОМ. — инварианты 
[Вал92], получаемые в результате преобразования контурных 
,6) объектов из декартовой системы координат в полярную, и их раз- 
вертки в прямоугольную форму, показанную на рис. 3.1.5 с пра- 

вой стороны. 
50’ 1. Запишем исходные координаты контура в форме вектора Х, 
состоящего из М комплексных чисел: 


м х = (+), (= +), (ин + Мн). (3.3.9) 
2. Центрируем исходные данные относительно среднего зна- 

и. чения: 

: Х=Х-Х, (3.3.10) 


где Хи среднее значение вектора Х. 
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Программа 3 
БпсНоп [В,ТЕТА] = чи КХ) 


% Вычисление УМГ- инвариантов 
% Х — вектор неупорядоченных комплексных чисел (координат); 
% В — полярный радиус; 

% ТЕТА - полярный угол (в градусах) 


% Центрирование исходных данных 
| Мх = теап(Х); 

| Хо =Х-Мх; 

|] 


% Вычисление полярных координат 
[еьго] = са(2ро!(геа!(Хо), птаз(Хо)); 


| % Сортировка по полярному углу, перевод в градусы 
| [ТЕТАлпдех] = з0о((е); 


ТЕТА = (ТЕТА-ТЕТА(1))*360/(2*р1); 


| 

| % Нормировка радиуса по масштабу к “1” 
Мах = тах(аБ5(Хо)); 

В = го(мдех)/Мтах: 





| 
% Конец процедуры 








углы для всех пар центрированных координат: 





| 3. Вычислим нормированный полярный радиус и полярные 
\ 

| 

| 

| 


| д- чо увж(хо)} 

| © = агс (пав (Хо )/теа(Хо)), (3.3.11) 
| где тах(Хо) — максимальный элемент в векторе о 
| | 














лярных координат: а — исходные образы; Ь — преобразован- 
ные образы 


| Рис. 3.3.3. Развертка контурного образа с использованием по- 
| 
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В соответствии с (3.3.11), значения полярного радиуса будут 
находиться в пределах от 0 до 1. Такая нормировка радиуса позво- 
ляет элиминировать масштаб преобразуемых образов. Полярный 
угол может быть представлен в различных шкалах: либо в диапа- 
зоне —л < 9 <л, либо в диапазоне от 0 до 2х, либо, наконец, в диапа- 
зоне от 0 до 1. Если полярные координаты приведены к дианазо- 
нуот 0 до 1, то пересчет всех значений радиуса и угла 6 в значения 
координат соответствующего бинарного ОМТ.-образа (как цифрово- 
го изображения) не представляет трудностей. Программа в языке 
пакета МАТГАВ, реализующая представленный алгоритм, приведе- 
на ниже (Программа 3). 

Результат преобразования различных контурных образов по 
приведенному выше алгоритму представлен на рис. 3.3.3. 


3.4. ИНВАРИАНТЫ ГЕОМЕТРИЧЕСКИХ ПРЕОБРАЗОВАНИЙ 


Один из подходов к решению задач распознавания образов ос- 
новывается на сравнении каждого нового образа с эталоном и 
оценке меры подобия между ними. Эталоном в этом случае мо- 
жет быть, например, ранее зарегистрированный образ. 

На практике распознаваемый образ и образ-эталон, как правило, 
отличаются друг от друга масштабом представления, поворотом и 
сдвигом. Для образов одного и того же класса в большинстве та- 
ких случаев исходят из того, что распознаваемый образ появился 
в результате геометрического преобразования (масштабирования, 
поворота в плоскости ХУ и циклического сдвига) образа-эталона. 
Если последовательно выполнять все возможные геометрические 
преобразования (повороты, сдвиги и изменения масштаба) эталон- 
ного образа и при этом сравнивать результат преобразования с рас- 
познаваемым образом то, в конце концов, можно зарегистрировать 
те параметры преобразований, при которых выступает наивысшее 
значение меры подобия. Ясно, что такой многоитерационный под- 
ход (распознавание через регистрацию), используемый, например, 
при распознавании отпечатков пальцев, относительно трудоемкий 
с вычислительной точки зрения. 

Другой подход строится не на сравнении самих образов, а на срав- 
нении инвариантов их геометрических преобразований. При этом 
инвариант эталона вычисляется заранее и хранится в памяти, а срав- 
нение нового образа с эталоном происходит за одну итерацию сразу 
же после вычисления его инварианта. 

На практике распознавания образов применяются инвариан- 
ты, основанные на моментах, О МТ.-преобразованиях и преобразо- 
ваниях Фурье—Меллина, на разностных функциях, оценке функ- 
ции расстояний и др. [А14199, Веп98а,Ъ, Сре94, Клс99а, Вал92]. Ниже 
будут представлены некоторые из перечисленных инвариантов. 

ОМГ-инварианты. Первый пример, демонстрирующий неизмен- 
ность некоторых параметров ОМГ-инвариантов контурного обра- 
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Рис. 3.4.1. Исходные образы (а) и их ОМГ--инварианты (Ъ) 


за, подвергнутого геометрическим преобразованиям, приведен на 
рис. 3.4.1. 

Пример взят из практики распознавания рукописных цифр, 
где широко используется ОМГ-преобразования [Вап92]. Из ри- 
сунка видно, что вычисленные новые образы действительно оста- 
ются неизменными независимо от размера цифр и их цикличе- 
ского сдвига в плоскости ХУ. Поворот же исходного образа в де- 
картовой системе координат на некоторый угол заменяется со- 
ответствующим циклическим сдвигом инварианта, представляе- 
мого в полярной (развернутой) системе координат. Последнее об- 
стоятельство, как известно, не является препятствием для исполь- 
зования ОМГ-инвариантов. Для сравнения циклически сдвину- 
тых образов наиболее часто, например, применяется взаимная 
корреляция и построенная на ней согласованная фильтрация. 

Еще один пример ОМГ-инвариантов представлен на рис. 3.4.2, 
где в верхней части рисунка приведены пять образов, имеющих 
различные масштабы, повороты и сдвиги. 

Над каждым исходным образом приведены значения угла его 
поворота в плоскости ХУ и масштаба его изменения по отношению 
к первому образу. В нижней части рис. 3.4.2 представлены вычис- 
ленные инварианты. Здесь отчетливо заметен циклический сдвиг 
О МГ-преобразованных образов вдоль оси Х — развернутого поляр- 
ного угла. При этом разница в сдвигах между самым левым и са- 
мым правым образами составляет ноловину длины ОМТ.-преобра- 
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Рис. 3.4.2. Исходные образы и вычисленные для них ОМТ.-инварианты 
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х\ зованного образа, что строго соответствует разнице в 180° 
9 исходными образами. 
%. Из приведенных на рис. 3.4.1 и 3.4.2 примеров видно, что ин- 
терпретация результатов ОМГ.-преобразований и само их вычисле- 
ние не вызывает трудностей и, следовательно, их можно рекомендо- 
вать для применения в задачах распознавания образов. В прило- 
Ч жении к биометрике эти преобразования и построенные на них 
инварианты можно применять в задачах распознавания подписей 
и других рукописных знаков. 
Инварианты АЁте Агс Гепа (ААТ,) и Епс10зе4 Агеа (ЕА). 
Инварианты ААГ, и ЕА для аналитически заданных кривых 
(контуров) можно определить следующим образом [А!199, Т1е97]: 


между 





Аше Агс еп Епс]озед Агеа 
а а 
МЕ 1 . : 
т= | 3/ (59 — 59) а б=5 | |9 (3.4.1) 
Г. ь 
ДВИНУ. 


ИМНАЯ Для случая цифровых изображений и контуров, заданных М 
ЧИ, координатами, первая и вторая производные заменяются конеч- 
349 ными разностями первого и второго порядков: 


(2) = х@+1)- (6); 5(#) = *(@+1)-2(); (3.4.2) 


ие #- +1) -и) +1) 
дя Вр, М длЯ =] дне 








(Поль. 














роди С учетом (3.4.2) инвариант ЕА можно вычислить следующим 
оляр’ способом: 








0 для = 1; 


с(®) = Туи -1)-х(+ Пий] для № = 2,3,...,М. ны 
1=1 


=] Программа в языке пакета МАТГАВ, предназначенная для вы- 
| числения инвариантов ААГ и ЕА, представлена ниже (Програм- 
7 ма 4). 
| Координаты контура (фигуры или образа), для которого опре- 
деляются инварианты ААЁ и ЕА, должны быть заданы в комп- 
и | лексной форме, подобной (3.3.9). Амплитуда вычисленных значе- 
ний инвариантов ААГ и ЕА нормирована к единице, соответству- 
ы ющие масштабные коэффициенты вычисляются и выводятся как 
выходные параметры Ба и 5е (см. соответствующие строки в конце 
И программы). Число элементов в векторах ААГ и ЕА, представля- 
ющих инварианты, должно быть равно числу ее контура. 
| Вид инвариантов АЁЁше Агс Тепё\ и Епс1озе4 Агеа показан на 
п рис. 3.4.3. Представленный здесь результат получен по програм- 
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Программа 4 
КапсНоп [АГТ,, Е_А, $а, $е] = ААГ._ЕА(Х) 


% Вычисление инвариантов АЁййпе Агс Гепа В и Епс105е4 Агеа. 
%Х - вектор координат образа (комплексная форма записи); 

% АМ, - функция АЁше Агс Гепо (нормированная к 1); 

%5а — масштабный коэффициент для АЁше Агс Гепа ; 

% В_А - функция Епс1юзе4 Агеа (нормированная к 1); 

% 5е — масштабный коэффициент для Епс!озе4 Агеа. 





% Выбор координатхиу 
Кх = геа(Х); Ку=ипаз(Х); 


% Вычисление первой конечной разности координат 


хр= [0 а! кх)]; у_р = [О аи ККу)]; 


% Вычисление второй конечной разности координат 


х_рр = [0 Оанжанккх))]; у_рр = [0 0 аикани(ку))]; 


% Вычисление инварианта АЙпе Агс еп? 
АЫ, = ситзит(аЪз(х_р.*у_рр — х_рр.*у_р).^(1/3)); 
ба = тах(АТТ.); АП, = АЦ, / $а; 


% Вычисление инварианта Епс1озе4 Агеа. 
ВА ситзши(а6з(Кх.*у_р-Ку.*х_р))/2; 
5е = тах(Е_А); Е_А =Е_А/бе; 





% Конец программы 


ме 4 для образов (первая строка рисунка), аналогичных рассмот- 
ренному выше примеру. Всю вторую строку на рис. 3.4.3 занима- 
ют инварианты А{Нпе Агс Гепя4В, а инварианты Епс]озе@ Агеа 
размещены соответственно на третьей строке. 

Отмечая независимость полученных результатов от изменений 
исходных образов (угла поворота, масштаба и сдвига), обратим 


внимание на некоторую своеобразную «невыразительность» функ- 
ций, представляющих обсуждаемые инварианты. Последнее об- 


стоятельство, возможно, может затруднить их использование в 
задачах распознавания при большом числе к. 
Кроме того, поскольку вычисление ААТ, и 
лением конечных разностей (дискретного аналога операции диф- 
ференцирования) очень чувствительных к шумам, применение 
инвариантов ААГ, и ЕА требует предварительного сглаживания 
линий контуров и, если границы их сильно за: 
буется их существенная фильтрация [Че97]. 
Инварианты, основанные на матрице расстояний. Как извест- 
но, расстояние (3.1.1) между двумя точками на плоскости не из- 
меняется при их синхронном сдвиге и повороте. Это свойство 
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лассов образов. 
ЕА связано с опреде- 


шумлены, то потре- 
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Рис. 3.4.3. Исходные образы (а) и вычисленные для них инварианты А ште 
Агс Тепё\ (Ъ) и Епсозе4 Агеа (с) 


можно использовать при построении инвариантов контурных о0б- 
разов на бинарных изображениях. 

Рассматриваемый здесь класс инвариантов вычисляется как 
расстояния между нормализованными координатами контурного 
образа [Кис99а]. Нормализация координат позволяет дополни- 
тельно к отмеченному выше свойству элиминировать масштаб 
представления образа. Нормализация выполняется отдельно по 
каждой координате. Последнее связано с тем, что рассматривае- 
мый контур может быть получен как проекция на плоскость кон- 
турного объекта из трехмерного пространства. При такой проек- 
ции масштаб по каждой из координат не всегда сохраняется оди- 
наковым. 

Весь процесс вычисления инварианта можно представить сле- 
дующим образом: 

1. Запишем исходные координаты контура в форме вектора х: 
состоящего из № комплексных чисел: 


Х = (=, + пп), (= * Ду), -.. (хм х мк) - (8.4.4) 


2. Центрируем исходные данные относительно среднего зна- 
чения: 


Хх. =; (3.4.5) 
где Х — среднее значение вектора Х. 
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3. Вычислим нормированные координаты: 


хм) - геа1(Х. 0 )/ пах(геа1(Х 0 ) $29 [лав (х 0 )/ тах(ппае (х 0 ). (3.4.6) 


где тах(*) — максимальный элемент. 


4. Теперь на основании (3.1.1) можно вычислить матрицу рас- 
стояний для всей совокупности нормированных координат: 


4,1 4,2 41 м 
а; а 

ОР чара, | (3.4.7) 
ам ` с ам 


где 4,, — расстояние между 1-й и]-й координатами ий, /=1, 2, =>, 


Программа в языке пакета МАТГАВ, предназначенная для 
вычисления матрицы 


расстояний, приведена ниже (Программа 5). 
На рис. 3.4.4 прив 


едены контурные образы руки, полученные 
для различных параметров масштаба, поворота и сдвига, и вычис- 
ленные для этих образов матрицы ра 


сстояний. 

Сравнивая между собой полученные матрицы расстояний, мож- 
но отметить, что все они одинаковые. Взаимная корреляция межу 
ними равна строго 1. При этом, даже если пункт начала обхода 
каждого контура будет разным, значение взаимной корреляции 





Г Программа 5 
РапсНоп [О, КХУ] =ту_ЮКху); 
% Кху - вектор-столбец координат "Х" и "У" исходного 
% контура; 
% КХУ - вектор-столбец координат”Х" и "у" 
% нормализованногоконтура; 
% О 


— матрица расстояний (инвариант) 


% Центрирование и нормирование данных 
ММ = теап(Кху); Кх 


У=Кху-ММ; 
Кх = геа(Кху); Ку= ипаз(Кху); 
тах_Х = шах(кх); шах_У= тах(Ку); 
Кх = КхЛпах_Х; Ку= Ку/тах_У; 
КХУ = Кх+}*Ку; 


% Вычислениематрицы расстояний (инварианта) 


Р=КХУ * опез(1, 1еп2(КХУ)); } 
Р =а6з( р-р. ); 





% Конец программы 
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Рис. 3.4.4. Образы (а) и соответствующие им матрицы расстояний (5) 


не изменится, а пик ее сдвинется на то число строк и столбцов, 
которое будет соответствовать разнице в порядковых номерах 
пунктов начала обхода контуров. Таким образом, матрицы рас- 
стояний являются инвариантами геометрических преобразований 
(сдвига, поворота, изменения масштаба) образов в плоскости ХУ. 

А теперь представим результаты сравнения образа-эталона 
руки с аналогичными (рис. 3.4.4) образами, границы которых силь- 
но зашумлены. В данном эксперименте наложенный шум изме- 
нял границы контуров в пределах +5 пикселей по каждой коорди- 
нате. Такое или подобное представление контурных образов может 
возникнуть на практике при обработке реальных данных. Все эти 
образы представлены на рис. 3.4.5. 

В нижней части рис. 3.4.5 под каждой матрицей расстояний 
указаны оценки взаимной корреляции между матрицей образа- 
эталона и остальными матрицами. Видно, что значения взаимной 
корреляции доходят до величины 0,8, что свидетельствует о подо- 
бии всех образов между собой. 





45 (0.9) 90 (.8) 135 (07) 180 (0.5) 


а Эталон 








0.79256 (0.0) 0 78455 (0.0) 0.79255 (0,0) 0.78455 0,0) 0.79255 (0, 0) 











Рис. 3.4.5. Образ-эталон (а), контрольные образы (®) и соответствующие им матри- 
цы расстояний (с), а также корреляция между ними 
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Рис. 3.4.6. Вид двумерной корреляции между образами с рис. 3.4.4 и 3.4.5 


Вид взаимной двумерной корреляции для рассмотренного при- 
мера показан на рис. 3.4.6. Здесь слева показан график корреляции 
образов, не подверженных влиянию шума, а справа — двумерная 
взаимная корреляция образов, подверженных влиянию шума. Сме- 
щение пика корреляции на величину Ах = Ду связано с упомянутым 
выше различием в выборе начального пункта обхода контуров. 

Наконец, отметим, что матрицы расстояний для различных об- 
разов будут существенно отличаться, а корреляция между ними 
будет близка к 0. 

Подводя итог сказанному, представим рассмотренные выше ин- 
варианты для трех различных образов (рис. 3.4.7). Естественно, 
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что выбор того или иного инварианта зависит от конкретной за- 
дачи и условий получения образов. Среди представленных мож- 
но рекомендовать инварианты, основанные на О М1.-преобразова- 
ниях и матрицах расстояний, ввиду простоты их вычислений, ин- 
терпретации и применения. 


3.5. ОБРАБОТКА ИЗОБРАЖЕНИЙ 
С ИСПОЛЬЗОВАНИЕМ ПРЕОБРАЗОВАНИЙ ФУРЬЕ 


В настоящем разделе рассмотрено двумерное дискретное пре- 
образование Фурье (ДПФ) и наиболее часто используемые в циф- 
ровой обработке изображений процедуры, основанные на ДИФ. 


3.5.1. ИЗОБРАЖЕНИЕ И ЕГО ПРЕОБРАЗОВАНИЕ ФУРЬЕ 


Пусть вектор Х представляет некоторый цифровой сигнал во 
временной области, а вектор С — этот же сигнал в области преоб- 
разования Фурье (спектр сигнала). Тогда прямое и обратное ДИФ 
(пара ДПФ) могут быть записаны следующим образом [Даг83, 


Кис98а]: 
С=Еух 
м (3.5.1) 
Х =ЕХ С, 
где 
ОМС о @°, 
ох о в фм ' 
С [0% 07. < г в2(\-9 — матрица преоб- 
| разования 
60 Ф("-Й 2-9 ши" в (3.5.2) 
2п 
т : 
ибм = тай (3.5.3) 
м о Тм ,] 
Например, для М=2 в соответствии с (3.5.2) получаем 
оно 
в = 01 = } . | (3.5.4) 
08 ве 
Матрица Ку симметричная, унитарная и ортогональная, так что 
1 
Е! = Зе Р ЕЕ А (3.5.5) 


Пусть теперь нам задана матрица Хх, которая представляет 
некоторое цифровое изображение, и матрица Су, определяющая 
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это же изображение в области преобразования Фурье (спектр). 
Тогда пару двумерных ДПФ (прямое и обратное) можно записать 
следующим образом: 





Ст = Ай 
АВА (3.5.6а) 
Ку = Ро ы 
Выражение (3.5.6) можно записать также в форме 
т Мама 
С(ь,1) = уе У У х(, печ (т + т) 
| = (3.5.65) 
| МЬ— №М-1 эп 
| Х(п,т) = сб деч 1 (вт + (т), 
| &-0 1-0 м 
| в=1,2,...,М; _ [п=12,...,М; 
где 

| И ое т=Ь2а,..., М. 





| В выражениях (3.5.6) использован способ представления сис- 
|] темы координат, показанный на рис. 3.5.1. 

В практике цифровой обработки изображений используется 

такой способ представления спектра, при котором он становится 

| циклически сдвинутым в центр по осям Ё и [. Результат такого 

| | представления спектра показан на рис. 3.5.2. Здесь 1 — исходное 





изображение; 2, 3 и 4 — абсолютные значения спектра, причем 


2 — спектр, представленный в системе координат, показанной на 


рис. 3.5.1 и определяемый но (3.5.6); 3 — спектр, циклически |8 


сдвинутый в центр по оси Ё и [; 4 — тот же спектр, представлен- 


| ный в форме ЗО. 





| Рассматривая третье изображение на рис. 3.5.2, обратим вни- ‚ Е 

| мание на его особенность: теоретически здесь должны быть от- з 

| четливо видны две оси симметрии спектра. Первая, сязанная с тем, 
что исходное изображение действительное, а спектр определяется 

| | по (3.5.6) с использованием симметрической матрицы (3.5.2); вто- 
| 


рая ось, определяемая симметрией исходного изображения, напри- 
мер, такого, как образ лица. 
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Рис. 3.5.2. Цифровое изображение и формы представления его спектра 


Е 
































Рис. 3.5.3. Связь между поворотом изображения и его 
спектром 


При этом, если исходное изображение будет повернуто на не- 
который угол ф в плоскости ХУ, то и его спектр будет также по- 
вернут на тот же угол ф. Эту зависимость можно заметить на 
рис. 3.5.3, где представлены исходные изображения, повернутые в 
плоскости ХУ на разные углы, и соответствующие им спектры, 
также повернутые на эти же углы. 


3.5.2. ПРИМЕНЕНИЕ ДИСКРЕТНОГО 
ПРЕОБРАЗОВАНИЯ ФУРЬЕ 


Представленные ниже процедуры цифровой обработки изобра- 
жений основаны на использовании свойств ДПФ (линейности, 
ортогональности и обратимости ДИФ, существования свойств ДПФ 
для свернутых и перемноженных сигналов и т. д.). Собственно 
ДИФ реализуется, как правило, с использованием процедур быст- 
рого преобразования Фурье (БПФ). Как первое, так и второе со- 
здают возможности построения простых для понимания и неслож- 
ных (быстродействующих) для реализации алгоритмов цифровой 
обработки изображений. 
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Рис. 3.5.4. Схематическое представление процедуры интерполяции 














Двухмерная интерполяция. Под интерполяцией будем пони- 
мать здесь увеличение числа пикселей на изображении вдоль обе- 
их осей, что влечет за собой изменение размера изображения и 
соответствующее изменение его яркости (для полутоновых изоб- 
ражений, например). 


Процедура интерполяции, основанная на ДПФ, представлена 
схематически на рис. 3.5.4 [Кис98]. 





в 
Исходное изображение Хи его спектр Су имеют размер Мх № Хы — 
пикселей. В результате интерполяции исходное изображение уве- Сх. 
личивается в Г. раз, где Г. > 1, целое. Для обозначения прямого и ° на ри‹ 
обратного двухмерного преобразования Фурье (3.5.6) здесь и да- На 
лее приняты следующие обозначения: ции и: 
Рен 
прямое двухмерное ДПФ Ху — с; в 
^ РЯ ы ное сл 
обратное двухмерное ДИФ С), —* р. кажды 
Вся процедура интерполяции в соответствии со схемой 3.5.4 
реализуется следующим образом: 
1) выполняется прямое ДПФ исходных данных; 
2) матрица спектра С» разделяется на четыре подматрицы: а, 
Ь, с, а; 
3) формируется нулевая матрица Су, порядка № Г; 
4) в углы нулевой матрицы С», переписываются соответству- Хх 
ющие им подматрицы а, Ь, с, а; М 
5) выполняется обратное двухмерное дискретное преобразова- 
ние Фурье для матрицы Схг, результат которого представляет со- 
бой искомую интерполяцию 
^ | = 
Хмь = геа1 (РС, Ен), 
При реализации описанной процедуры интерполяции необхо- 
димо помнить о спектральных компонентах с номерами М/2 (диз чет. Рис. 3. 
96 
Г д. Кух 
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хм 
› уве 
ого И 
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ного №). В этом случае для получения точного результата интер- 
поляции, спектральные компоненты с номерами №/2 необходимо 


также перенести в матрицу Су, (на четвертом шаге процедуры). 
Фильтрация в частотной области. Рассматриваемые ниже 
процедуры относятся к фильтрации изображений в частотной 
области. На основе ДПФ можно выполнить низкочастотную (НЧ), 
высокочастотную (ВЧ), полосовую и режекторную фильтрацию. 
НЧ фильтрация исходного изображения, представленного мат- 
рицей Ху, реализуется следующим образом [Кис98]: 


а Ве[Еу'(Рух»Ен)ОРь Е |, (3.5.7) 


где Ру — матрица (порядка М) низкочастотного фильтра и такая, 
что 


Ру ={"хГи!= | 11...1000...0001...11 |; (3.5.8) 


Е+1 в 
был, 


м 


У знак векторного умножения; Е — нижняя граница фильтра; 


Ху — отфильтрованное изображение. 

Схема реализации низкочастотной фильтрации представлена 
на рис. 3.5.5. 

На рис. 3.5.6 приведены результаты низкочастотной фильтра- 
ции изображения при различных значениях параметра # — ниж- 
ней границы НЧ фильтра. 

Исходным здесь является выделенное изображение, показан- 
ное слева на рис. 3.5.6. Значения параметра # приведены над 
каждым отфильтрованным изображением. 
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Рис. 3.5.5. Схематическое представление процедуры низкочастотной филь- 
трации 


Т Г. А. Кухарев `. 

























Рис. 3.5.6. Результаты низкочастотной фильтрации в зависи 
фильтра 


Как показывают результаты фильтрации, 
ного представления образа лица человека достаточно от 20 до 30 
пространственных спектральных компонент. Учитывая это обсто- 
ятельство, можно значительно сократить размерность исходного 


пользуя, например, в качестве призна- 
компоненты. 


для удовлетворитель- 









Программа 6 






Гипс  ХЕ= Е 2(ХК); 






% Низкочастотная фильтрация изображения 
% Х- исходное изображение 


% К — нижняя граница фильтра 









% Формирование матрицы “ЕЕ” 
[М.М] = зме(Х); 

Й = 2его$(М, 1); 2 = 2его$(1,№); 
НСЕК+И,) = опез(К+1,1); Я (М-к+1:М,1) = опез(К,1); 
Р2(1:К+1) = опез(К+1,1); 22(М-К+1:№) = опез(К,1); 

БЕ =Н*Р2; 





для НЧ фильтра 









% Вычисление спе 


ктра исходного изображения 
С=#2(%); 






% Обнуление компонент спектра 
С = С.*ЕЕ; 
Х_Е= геаКИй2(С)); % окончание процесса 

















% Конец программы 
| 








мости от границ # 
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Несомненным достоинством реализации НЧ фильтрации в ча- 
стотной области (иными словами, через ДПФ) является ее простота 


и очевидная ясность в выборе па 
их интерпретации). 


ВЧ фильтрация цифрового изображения может быть реализо- 


вана в частотной области двумя представленными ниже алгорит- 
мами [Кис98а]. 


Алгоритм 1. Если записать результат НЧ фильтрации 
некоторого изображения как матрицу хе =. то ВЧ фильтрация это- 


го же исходного изображения может быть реализована следую- 
щим образом [Кис98а]: 


Хе ах ва, (3.5.9) 


раметров фильтра (т. е. ясность в 


Алгоритм 2. По этому алгоритму ВЧ фильтрация реали- 
зуется аналогично фильтрации НЧ с той лишь разницей, что в 
матрице Су (в спектре, полученном в результате ДПФ исходного 
изображения) вместо центральной ее части ‹обнуляются» квад- 
раты в углах этой матрицы. 

Вычислительный процесс при этом можно представить как по- 
казано на рис. 3.5.7. 

Полосовая и режекторная фильтрация. Двумерную полосовую и 
режекторную фильтрацию реализуют обычно с помощью комбина- 
ции НЧ и ВЧ фильтрации для различных выбранных параметров #. 

Вычисление двумерной свертки двух изображений. В прак- 
тике цифровой обработки изображений применяют обычно два 
вида свертки — циклическую и линейную. 

Двумерную циклическую свертку м двух цифровых изобра- 
жений Ху и Ух можно вычислить следующим образом [Кис98а]: 


к = Ве[Ру'(ЕнХьРу)© (Ен УЕ) }- (3.5.10) 

















Рис. 3.5.7. Схематическое представление процедуры высокочастотной 
фильтрации 


эз 

















Здесь и далее использованы обозначения, принятые нами ра- 
нее в разд. 3.2 и 3.3. Из (3.5.10) следует, что двумерная цикличес. 
кая свертка может быть реализована с использованием трех ДПФ 
и одного поточечного умножения матриц. Из трех ДПФ — два 
прямых — предназначены для вычисления спектра двух матриц 
исходных данных, и одно — обратное ДПФ, на его основе форми- 
руется результат свертки. 

Двумерную линейную свертку 2›м двух цифровых изображе- 
ний Хуи Ух можно вычислить следующим образом [Кис98]: 


бэк = Веер [(Рь» Хон ых (Рам знхЕДИ, (3.5.11) 


где Хэм = К ти и Ук = [8 ВИ 


[0] у — нулевая матрица порядка М ; оу — матрица Фурье поряд- 
ка 2М; 2, — матрица результата свертки. 

Вычисление двумерной корреляции двух изображений. Кор- 
реляция — один из наиболее распространенных способов провер- 
ки соответствия одного образа другому. В практике цифровой 
обработки изображений наиболее часто применяют следующие 


виды корреляции; амплитудные циклическую и линейную, а так- 
же фазовую. 


ми Ум можно вычислить следующим 
образом [Кис98]: 


жы ев [(вьхьвь (вульвы) вр -е,}, (3.5.12) 


где Хми Ум — матрицы исходных данных; 


т — энергия образа Х; 


о 


мм 
ву = УХУ, — энергия образа У; 


Вх — матрица результата корреляции. 

Двумерную амплитудную линейную корреляцию 
ровых изображений Ху и У» можно вычислить сло двух ие 
зом [Кис98а]: щим обра- 


Ем = ве ыыы хо (РВ вм) [в / У -*,) ‚ (8.5.18) 


Хы [0] _| Ум [0] 
где Хьм = Г и иУ»м = р: ю" 

















Оряд- 


‚ Кор. 
›оВер- 
ровой 
щие 
а так- 


ДВУХ 
ЮЩИМ 


[0] у — нулевая матрица порядка М; Ру — матрица Фурье порядка 
2М№; 7›м — матрица результата свертки;е,, е, — определены в (3.5.12). 
Максимум г„.х двумерной корреляции показывает меру подо- 
бия двух изображений (образов) между собой. При этом 0 < гиах 2 1, 
и, чем ближе г,„„ к единице, тем ближе один образ к другому. 
Однако адрес максимума корреляцииА„, показывает, на сколь- 
ко пикселей один образ циклически сдвинут (вверх/вниз или вле- 
во/вправо) относительно другого. При этом, если образы не сдви- 
нуты относительно друг друга, Аша» = (0, 0) или Ашах = (1, 1), что 
зависит от способа нумерации пикселей на изображениях. 
Значение максимума корреляции и его положение — это два 
основных параметра, используемых при оценке меры соответствия 
образов друг другу. 
Двумерную фазовую корреляцию 2х двух цифровых изображе- 
ний Ххи Ух можно вычислить следующим образом [Кис98а]: 


В® = Ве Ру [екр({Ф _-Ф® 3 :] (3.5.14) 


( 
где 1 =\-1; Ф® их Ц) — матрицы фазовых углов для спектров 
се и с ‚ полученных как результат ДИФ исходных данных Хм 
и Ух соответственно. 

В свою очередь, фазовые матрицы определяются так: 


(=) (и) 
Ф@®) = агош ыы ; < = ош =. - (8.5.15) 


Внешний вид двумерной фазовой корреляции был представ- 
лен на рис. 3.4.6 при оценке свойств инвариантов. Программы в 
языке пакета МАТГАВ, предназначенные для вычисления взаим- 
ной корреляции по процедурам (3.5.12) и (3.5.14) представлены 
ниже (Программы 7 и 8). 

Согласованная фильтрация. Пусть образ Хм является обра- 
зом-эталоном, а образ Ум получен в результате наложения на об- 
раз-эталон некоторого шума: 


Уи=Хи+ 5, (3.5.16) 


где бу — матрица порядка М, определяющая некоторый шумовой 
образ. 

В случаях (3.5.16) говорят, что образ Ху находится под шумом, 
если отношение сигнал/шум меньше единицы (с/ш < 1). 

Реализуя согласованную фильтрацию, можно обнаружить факт 
присутствия образа Хм в образе Ух. Для этих целей используют 
корреляцию между образами Хми Ум. И это обнаружение стано- 
вится возможным в случаях, когда образы Хм и 5х не коррелиру- 
ют между собой. 
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Программа 7 
Фмосноп (Я, уу, хх, пах7] = Когйиа2 (Х,У); 


| % Вычисление амплитудной циклической корреляции 
% между двумя образами. 
% Х и\У - матрицы исходных данных; 
% 7 — матрица корреляции; 
% тпахЯ, -— значение максимума корреляции; 
% уу,хх - координаты максимума корреляции 
% Проверка согласованности размеров данных 
И я12е(Х) -= $12е(У) @1зр(Х -= У’); гецит; епа; 
% Вычисление спектров 
[пуп] = $12е(Х); 
Сх = Н2(Х)/(ш*а); Су= #2(У)/(т*п); 
% Вычисление энергии 
$ = $492(Сх); $2 = $142(Су); пит = $1*$02; 
% Вычисление матрицы корреляции 
7. = абз(И2(Сх.*соп(Су)) пт; 
% Определение значения и координат максимума 
тлах7, = тах(плах(7,)); 
[уу,хх] = па (7, ==тах7)); 
% Конец программы 


































Программа 8 





РпсНоп [7, шахй, уу, хх] = Ког#а22(Х,У); 
% Вычисление фазовой корреляции между двумя образами. 


% Х и\У -— матрицы исходных‘данных; 
% 7 — матрица корреляции; 

% тах — значение максимума корреляции; 

— координаты максимума корреляции 





% Проверка согласованности размеров данных 
И яте(Х) -= 51е(У) 415р('Х -= У"); гешги; епа; 
% Вычисление спектров и фазовых углов 
[пл,п] = $12е(Х); 
Сх = И2С/(т*п); Су = 2(У)(т*п); 
Ех = ап е(Сх); Бу = ап е(Су); 
с1еаг Сх Су; 
% Вычисление матрицы корреляции 
ое = за" (1); 
7, = теа(ИИ2(ехрдо*(Ех-Ру)))); с1еаг Ех Ву; 
4% Определение значения и координат максимума 
тахй, = тах(тах(7.)); 
[уу.хх] = Япа(7, == тах7.); 





% Конец программы 











Эталон 


Образы «под шумом» 












0.52111 0.36279 0.28308 








Рис. 3.5.8. Результаты согласованной фильтрации 


Пример согласованной фильтрации приведен на рис. 3.5.8, гдев 
верхней части представлены образ-эталон и образы, находящиеся 
под шумом, а в нижней части показано, как коррелируют эти образы 
между собой и с образом-эталоном. В данном случае была использо- 
вана фазовая корреляция. Левая корреляция относится к автокор- 
реляции образа-эталона, поэтому она равна единице. 

В задачах распознавания образов оценку факта обнаружения 
сигнала в шуме определяют по следующему соотношению [СВе94]: 

555 = р м) - 
где М — среднее значение корреляции (для всей матрицы корре- 
ляции); р — стандартное отклонение корреляции (для всей мат- 
рицы корреляции); Г»ах — значение максимума. : 

При использовании для реализации согласованной фильтра- 
ции фазовой корреляции соотношение 588 > 1 даже при очень 
больших амплитудах наложенного шума. Оценивая результат, 
представленный на рис. 3.5.8, отметим, что поставленная задача 
согласованной фильтрации успешно решена. 


3.6. МЕТОД, ГЛАВНЫХ КОМПОНЕНТ 
В настоящем разделе будет кратко изложена основная идея 
метода главных компонент (англ. РСА) на примере сокращения 


исходного пространства признаков в задачах распознавания лиц. 


103 
































































В разд. 2.3 рассматривалось несколько способов формирова- 
ния исходного пространства признаков в подобных задачах, Сре- 
ди них упоминались, например, следующие способы: 

1) формирование вектора признаков в результате конкатена- 

ции строк или столбцов матрицы исходного изображения лица; 

2) формирование вектора признаков из матрицы спектра изоб- 
ражения лица; 

3) определение каждой строки исходного изображения лица 
как самостоятельного вектора признаков; 

4) определение каждого столбца исходного изображения лица 
как самостоятельного вектора признаков; 

5) формирование вектора признаков из координат фиксиро- 
ванных точек контурной модели лица. 

Напомним, что если изображение лица имеет размер М х М пик- 
селей, то, следуя способу 1, исходное пространство признаков бу- 
дет иметь размерность ММ. Например, для М = М = 100 оно соста- 
вит величину 10000. Именно поэтому размеры изображения лица 
(перед формированием вектора признаков по первому способу) 
существенно снижают, например до 20 — 30 % от исходных разме- 
ров. Схематически этот процесс представлен на рис. 3.6.1, где 
цифрой 0 обозначено исходное изображение лица, а цифрой 1 — 
то же изображение, но уменьшенное в размерах и предназначен- 
ное для конкатенации его строк (или столбцов) в вектор. Цифрой 
2 обозначен спектр исходного изображения, из которого форми- 
руется вектор признаков с учетом симметрии спектра и важнос- 
ти только первых 20 пространственных компонент. Изображения, 


отмеченные цифрами 3 и 4, соответствуют т 
способам получения векто 


И, наконец, изображение, отмеченное цифрой 5 





[1 





го ему пространства признаков. 
Размерность пространства признаков, равная числу компонент 
в векторе признаков, которая остается в 


_ о результате выполнения 
с выше деиствий для каждого из способов, приведена в 
таол. 5.0.1. 


Признаки, получаемые любым из представленных выше спо- 
собов, имеют две особенности: размерность пространства призна- 
ков остается все еще значительной (см. табл. 3.6.1), а ранг отдель- 
ных признаков (или их важность для представления всех и каж- 
дого отдельного исходного изображения) еще не определен. Обе 
эти особенности, естественно, усложняют, а порой и затрудняют 
решение проблемы распознавания лиц. 

Анализ главных компонент позволяет решить 
дачи: 

1) определить ранг признаков; 

2) существенно сократить размерность пространства признаков. 

Покажем теперь, в чем заключается основная идея метода глав- 
ных компонент, на примере сокращения пространства признаков 
определяемого по способу 1 (см. рис. 3.6.1). з 
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две главные за- 
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Рис. 3.6.1. Изменения исходного изображения в процессе формирования 
исходного пространства признаков 





Следуя общепринятой терминологии задач распознавания, пред- 
ставим метод главных компонент, используя понятие образа как 
отдельного элемента класса образов и понятие вектора признаков, 
определяющего каждый образ в классе. 

Итак, исходным для нас является представление каждого об- 
раза вектором признаков 


х = [(1,2), «(@,), „(мы )|, (3.6.1) 


где; — номер образа (1 =1, 2, ..., М); х(п, 1) — значение признака; 
п — номер признака (п =1, 2,..., №); М — размерность пространства, 
признаков (число признаков). 


Таблица 3.6.1 
Размерность пространства признаков. 





Способ выбора признаков 1 


|- 


Размерность пространства | 600-1000 




















В соответствии со схемой анализа главных компонент, пред- 
ставленной в разд. 2.3, выполним следующие действия: р 
1. Определим средний образ, для чего вычислим средний вектор 






(3.6.2) 


2. Запишем исходные данные в матрицу исходных признаков 
так, что 


Рукм = [х® -Х) (9-х). (х09--Х]|\ (3.63) 





тде Оухм — матрица размера Мх М. 
| 3. Вычислим матрицу ковариации 
| Т 
| Еххм = Рухк(Рьхн) . (3.6.4) 
й 
й 
| 
] 


4. Для матрицы (3.6.4) определим собственные числа и соот- 
ветствующие им собственные векторы, для которых, в свою оче- 
редь, выполняются условия 







т 
Амхм = [Уж | ВмхмИмхм › (3.6.5) 


где/Лл хм — диагональная матрица, 
щены собственные числа; Ух. — о 
которой определяют собственные в 
ственным числам. 

5. В диагональных элементах матрицы Лухм отыщем р наи- 


больших собственных чисел, причем р < М (именно здесь как бы 
определяется ранг признаков). 


6. Из матрицы ры выберем р строк, 
наибольшим собственным числам, 
рицу Е, х м редукции признаков (ма. 
на—Лоэва). 

7. Для каждого образа из матрицы исх. 
полним преобразования Карунена—Лозва, 
представлено в форме 


Урхм = ЕрхмОмхм , (3.6.6) 





на диагоналях которой разме- 
ртогональная матрица, строки 
екторы, соответствующие соб- 



















соответствующих р 


из которых сформируем мат- 
трицу преобразования Каруне- 


одных признаков вы- 
которое может быть 


где М = [Е у 
ном пространстве; У® — 
признаков. 

Отметим, что в соответствии с (3.6.6) каждый образ предст. 
теперь только р новыми признаками в редуцированном = 
стве. Если использовать равенство Парсеваля для ое в 
такого образа, то окажется, что новые компоненты описывают к, 
тельно большую часть энергии, чем оставшиеся (не - 


учтенные ко 
ненты. Эти р новых компонент и называют главными а Вы, 


|: матрица признаков в редуцирован- 
образ в редуцированном пространстве 
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Программа 9 
Глпсбоп [ВЕО, А_КГТ, Г] = рса(О, р) 


% Анализ главных компонент и редукция пространства 
% признаков 


% О — матрица исходных признаков; 

% р — размерность редуцированного пространства 
% признаков; 

% ВЕБ — матрица редуцированных признаков; 

% АКТ — матрица КТ; 

% Г, — «р» собственных числа; 


% Вычисление матрицы ковариации 
[М,М] = $12е(0); 
М_СОУ = (2*р’)/М; 


% Вычисление собственных чисел и векторов 
[У, Г] = е>(М_СОУ); 
Г. = Фаз(Г.); 
[а, ша] = зо“(-Г.); а=-а; [=а; 
У = У(: па); 


% Проверка ортогональности матрицы У 
Т= У*У’; К = зи (41а2(0)); 
И В- =М 915р(???_1_777'); гешги; епа; 


% Формирование результата 
[=тТ. (1:р); 2=Р 
А_КИР=УСИ:р); 
ВЕР = А_КГТ*О; 





% Конец программы 





Размерность редуцированного пространства признаков равна те- 
перь также р, что меньше исходной размерности в М/р раз. Число, 
всех признаков равно рМ, что меньше превоначального числа так- 
жев №/р раз. 

Программа в языке пакета МАТГАВ, предназначенная для ана- 
лиза главных компонент, вычисления матрицы преобразования 
Карунена—Лоэва и редукции пространства признаков, приведена 
выше (Программа 9). 


3.7. ПРЕОБРАЗОВАНИЕ ФУРЬЕ_МЕЛЛИНА 
Выше в разд. 3.1, 3.3 и 3.4 мы отмечали возможность представ- 
ления исходных изображений в развернутой полярной системе 
координат, а также анализировали уникальные инвариантные свой- 


ства получаемых при этом новых изображений. Эти же подходы 


107 











могут быть применены не к исходным изображениям, а ких спек 
трам, что также создает основу для получения аналогичных ин- 
вариантов плоских аффинных преобразований изображений. В при. 
ложении к спектрам эти преобразования определены в [СЬе94] 
как преобразования Фурье—Меллина. 

Однако необходимо отметить, что в обоих рассматриваемых слу- 
чаях цифровые изображения являются в некоторой степени спе- 
цифическими — это изображения, в поле рамки которых всегда 
выделен некоторый объект (один или несколько). Поэтому аф- 
финные (геометрические) преобразования — повороты, сдвиги и 
масштабирование — касаются именно этих выделенных на 
всем изображении объектов. Примеры таких изображений — 
см. на рис. 3.4.1 - 3.4.5. 

В приложении к биометрическим технологиям распознава- 
ния в [Веп98а,5] на основе преобразований Фурье—Меллина, оп- 
ределяются инварианты поворотов (влево/вправо) и наклонов 
(вверх/вниз) лица человека. 

Идея вычисления Фурье—Меллина инвариантов (ФМИ) состо- 
ит в следующем. 


1. Для исходных данных, представленных матрицей Ху, вы- 
числяется модуль спектра двухмерного ДПФ: 


Ск = [ЕуХыЕу|. (3.7.1) 


2. Матрица спектра (3.7.1) циклически сдвигается по строкам 
и столбцам так, что 


УЕ 
ы №/2 №/2 
с(>) - [4 =. си. (3.7.2) 
(№2) 
где 1х — единичная матрица порядка М№ с циклически сдви- 


нутыми на №/2 позиций вправо столбцами [Даг83]. 

Пример получаемого по (3.7.2) спектра показан на рис. 3.5.2. 
Отметим, что модуль спектра (3.7.1) является инвариантом цик- 
лического сдвига некоторого образа в поле рамки всего изображе- 
ния, а представление спектра в форме (3.7.2) позволяет легко 


преобразовать спектр [С из декартовой системы координат в 
развернутую полярную систему с .9) . Как отмечалось выше, при 
таком представлении спектра любой поворот исходного образа в 
плоскости ХУ (и в поле рамки исходного изображения) заменяет- 
ся циклическим сдвигом спектра вдоль оси 90 развернутого по- 
лярного угла. 

Если при представлении развернутой полярной системы по- 
лярный радиус определять в логарифмической шкале, то полу- 
ченный спектр будет представлять собой спектр Фурье—Мелли- 
на. Именно этот спектр и есть инвариант масштабных изменений 
(практически до 2—3 раз) исходного образа в поле рамки всего 
изображения. 
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Рис. 3.7.1. Три формы представления модуля спектра преобразования Фурье 





Примеры общего вида упомянутых выше спектров показаны 
‚ ВЫ на рис. 3.7.1. 
В отличие от целочисленных координат декартовой системы, в 
г которой перечисляются номера строк и столбцов матриц спект- 
Н ров, координаты в полярных системах координат не являются 
Ч целыми числами. Поэтому преобразование Фурье—Меллина за- 
ее канчивается процедурой интерполяции спектра (из декартовой 
системы координат) по вычисленным координатам полярной (по- 
лярно-логарифмической) системы. 
Преобразования вида С“) > с®) > се) > с(е=®}8) 





од" | 
Для изложения дальнейшего материала введем некоторые обо- 
352. значения, связанные с представлением спектров в различных си- 
р стемах координат [Кис9Та, Кис98с]. 
ие Итак, пусть 
о 
о 
сй „ №/2-1 мА емо 
и’ б= м1 В = РЕК сос ; 
м п 
я 0= [60,61,....бо-1|= 0 [0,2 ...9-1} (3.7.3) 
} 
48 
и’ , 
и с(=) (о, ) = <(®)з6, рооз6), 
и’ 
Г 
у 
д где № — порядок матрицы, представляющей исходный спектр; М — 
Я число дискрет полярного радиуса; © — число полярных углов на 
Я интервале 0 — л; р — вектор значений полярного радиуса; 69 — век- 
ий тор значений полярного угла. 
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С учетом (3.7.3), пространство декартовых координат, представ- 
| ляющих исходный спектр и соответствующих координатам поляр- 
ной и полярно-логарифмической системам координат, можно запи- 
| сать в форме следующих векторных произведений векторов р и 0: 

® для полярной системы координат 
| 


| Умхо =рхзтб; 


ы (3.7.4а) 
| Хмхо =БхХ 030; 

| ® для полярно-логарифмической системы координат 

| в(м-) с. 

| Умка = (№21) | ` тб; с 
|| Химхо т х с0зб. 


В выражении (3.7.4Ъ) логарифмирование значений координат 
в направлении поля 


рного радиуса аппроксимировано степенной 
| функцией [Све94]. 
| 


Рис. 3.7.2 дает графическое представление координат, опреде- 
| ленных в соответствии с (3.7.4) и в обозначениях (3.7.3). В левой 

| стороне рисунка — координаты полярной системы координат, ав 
| правой — координаты полярно-логарифмической системы. 

Для получения квадратных растров, заполняющих все спект- 
ральное пространство и аналогичных представленным справа на 
рис. 3.1.6, в выражениях (3.7.4) вместо векторов 511 0 и соз0 исполь- 
зуем соответственно векторы: 


(605) №. гов 9% с05 0, 


2 р Г {:: 
шах(51т 9%, соз 9.) тах (эт 0,, соз 9, > 

| 

| 

| 





| со до, 


.) 


ы , 
| тах (вт 91, соз 93 





(3.7.5) 
(зп) эт 9% эт 0, 
у = 


х ’ С ... 
тах(зт 0%, соз 0.) паах(1т 91, соз в, ) ; 











31 бо: 





5 
плах(5т 91, соз бей 


В случаях, когда исходное изображение (и соответствующий 
ему спектр) представлено не квадратной матрицей, а прямоуголь- 
ной размером №, х №. пикселей, вместо выражения (3.7.4Ъ) необ- 
ходимо записать: 
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Рис. 3.7.2. Расположение координат полярной и полярно-логарифмической 
систем на фоне спектра, представленного в декартовой системе координат 


для обычных растров 


Умка = (№ /2 - 1) М9 хвтаб; 


Е (8.7.6) 
Хмхо = (№/2- тим Х с036; 
для прямоугольных растров 
М 
Умка = (№/2- п у Зет 
в/(м- (соз) ‘ ф. ) 
хим ху) , 


В практике задач распознавания спектры Фурье и Фурье— 
Меллина описываются, как правило, размерами представляющих 
их матриц. Например, исходная матрица (исходного изображе- 
ния или спектра) имеет размер Мх М пикселей, а преобразован- 
ная — размер Мх @ пикселей и в общем случае М #=@ = М. 

Для случаев упомянутого матричного представления спектров 
можно по аналогии с (3.7.6) и (3.1.7) записать соответственно: 


№ /2-1 ай 
Умхо Ел 
я (3.7.8) 
№/2-1) оз 
в об аня 
АА 








№, /2-—1 ; № 
( 1/ ели МАН 


У 
Я М-1 2 (8.19) 
(№, /2-1 м, 
а Е Е зе у . 
мк е Г ВЕ +5 мха 
где [1] мхо — единичная матрица размера Мх ©; 
В, — для пространства полярных координат; 


(м- 1)8/ Ш. для пространства полярно-логарифмических 
координат. 


Программа в языке пакета МАТГАВ, предназначенная для 


вычисления координат по процедурам (3.7.8) и (3.7.9) представ- 
лена ниже (Программа 10). 





Программа 10 
псбоп [Х,У, ХУЙ = ро! _с(М1, №2, М, О, раг); 


% Вычисление полярных (полярно-логарифмических) координат. 
% №, № -— размер матрицы исходного спектра; 


ЭМО = размер матрицы для полярных координат; 
% раг — “0” ( для обычных) и “1” (для полярно-логарифмических.) 
% Х, У - координаты, вычисляемые по процедуре (3.7.8); 


% Х1, У1 - координаты, вычисляемые по процедуре (3.7.9); 


% Определение полярных углов и радиуса 
чега = 0: 2*0-1; 
В = (0:М-1)'; 
И раг ==1 В = (М-1.^(ВАМ-1)); епа; 


М1 = йх(М1/2); № = В х(№2/2); 


% Вычисление координат по процедуре (3.7.8) 
У= (1-м) *В* т (речена/О) + №1; 
Х= (М-ПХМП)*В*соз(речаа/О) + №; 


% Вычисление векторов Усоз и Узт 
У1 = зп (рРчеа/0); Х1= соз(рёчееа/О); 
УМ = [УП 
Усоз = Х1.Лтах(а6з(\М У); 
Узт = У1Лтах(абз(\МУ/)); 


% Вычисление координат по процед 
У1 = ((М1-ВАМ-0)*В*Узт + М1; 
Х! = ((\2-П^М-1))*В*Усоз + №; 


Уре (3.7.9) 


% Конец программы 
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Рис. 3.7.3. Представление координат, вычисленных по программе 10 


Результаты вычисления координат (по Программе 10) и раз- 
личные способы их представления координат показаны на рис. 3.7.3. 
Во всех случаях координаты определены для следующих значений 
размеров матриц: №, = 20, №. =10, М=8, @=20. Цифрами 1 и 2 
обозначены результаты, полученные по процедуре (3.7.8) для по- 
лярной и полярно-логарифмической систем координат соответствен- 
но. Различие между этими системами хорошо видно на нижних 
рисунках, где координаты, относящиеся к одному и тому же ради- 
усу, соединены между собой. Цифрами 3 и 4 обозначены результа- 
ты, полученные по процедуре (3.7.9) также для полярной и поляр- 
но-логарифмической систем координат соответственно. Нижние 
рисунки подчеркивают различие в вычисляемых по (3.7.9) поляр- 
ной и полярно-логарифмической системах координат. 

Для получения окончательного результата преобразования Фурье— 
Меллина необходимо выполнить переинтерполяцию по вычисленным 
координатам. Если положить, что совокупность координат Х0 и У0 
представляет некоторую матрицу спектра З_сагё в декартовой систе- 
ме, а совокупность координат Х и У (или Х, и У,) получена по про- 

грамме 10 [по процедурам (3.7.8) или (3.7.9)], то спектр 5_ро1 Фу- 
рье—Меллина можно вычислить, используя, например, процедуру 
«ифегр2» двумерной интерполяции пакета МАТГАВ [Пот99, Руд00]: 


$_ро1=Ицегр2(ХО, У0, $_сатф, Х, У, ‘ше об’). (3.7.10) 


Интерполированный по полярно-логарифмическим координа- 
там и развернутый спектр представляет собой окончательный 
результат преобразования Фурье—Меллина, который называют 
также инвариантом Фурье—Меллина (ФМИ [Све94]). 

Рассмотрим теперь пример использования инвариантов Фу- 
рье— Меллина для распознавания изображений, подвергнутых 
сильным изменениям в масштабе. На рис. 3.7.4 приведены во- 
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Образ 5 (338188) Образ 6 (320%338) | Образ 7 (170378) | Образ 8 (344х326) 








Рис. 3.7.4. Тестовые изображения глаз 


семь изображений глаз (размеры каждого изображения указаны 
в скобках). 


Шесть из них (1, 2, 3, 4, 5 и 7) принадлежат изображению одного 
и того же глаза. Наибольший размер здесь имеет образ 1 (338 х 378 
пикселей), а наименьший — образ 4 (84 х 94 пикселя). Образ 1 
базовый. Образы 2 — 5 и Т уменьшены в размерах по сравнению с 
базовым, причем масштаб образов 3 и 4 по обеим осям изменял- 
ся одинаково, а для образов 2, Би 7 — неодинаково (непропорци- 
онально). В свою очередь, образы 1, би 7 представляют изображе- 
ния глаз различных людей. 

В выполненном эксперименте сравнивались между собой все об- 
разы и оценивалась мера их подобия. Использование пути, связанного 
с выравниванием всех размеров к одному из них, не рассматривалось, 
поскольку и уменьшение размера изображения и увеличение его раз- 
мера приводит к потере качества цифрового изображения. Поэтому 
для элиминирования влияния различия в размерах №, и №. каждый 
образ подвергается преобразованию Фурье—Меллина с различными 
входными параметрами №, и № и одинаковыми выходными пара- 
метрами М и © [см. выражение (3.7.8) — (3.7.9)]. 

На рис. 3.7.5 представлены результаты 
нирования исходного спектра в полярно-логарифмической систе- 
ме координат. Цифры от 1 до 8 соответствуют номерам образов 
на рис. 3.17.4. 

Заканчивая поставленный эксперимент, 
вычисленные по (3.7.10) инварианты Фуры 
го используем двумерную фазовую коррел 
рой было дано в разд. 3.5. Полученные пр 
реляции представлены в табл. 3.7.1. 

Как видно из таблицы, образы 1-5 и 7 соответствуют друг 
другу, поскольку коэффициент взаимной корреляции 


между ними 
не ниже величины 0,88. В то же время образы первой группы 








для этого случая ска- 


сравним между собой 
е—Меллина. Для это- 
яцию, описание кото- 
м этом результаты кор- 


114 








7. 





аНы 


того 
318 
13 1 
С 
яЛ- 
Ци- 























} 


Хлиловолиииооомченололиьтивлоньнирлннилолой 








"ЖЕ: 








Рис. 3.7.5. Изменение способа сканирования спектров в преобразовании Фурье— 
Меллина в зависимости от размеров исходных изображений 


1-5 и Т не соответствуют образам 6 и 8, поскольку коэффициент 
корреляции между ними не превосходит 0,14. 

Таким образом, мы показали, что преобразование Фурье—Мел- 
лина [Све94] элиминирует масштабные изменения изображений. 
Элиминирование поворотов образов на изображениях основано на 
преобразованиях Фурье-спектров к полярной системе координат. 
Циклические сдвиги изображений элиминируются благодаря при- 
менению в преобразованиях абсолютных значений Фурье-спектров. 

Использование инвариантов Фурье—Меллина в биометриче- 
ских технологиях идентификации человека на основе радужной 
оболочки глаза представлено в работах [Вот97, 30197]. Примене- 
ние инвариантов Фурье—Меллина в задачах распознавания лиц 
показано, например, в работах [Веп98]. 


Таблица 3.7.1 
Результаты фазовой корреляции 








вы | аа: 
Образ 1 2 3 4 5 6 7 Г. 8 
1,0000 | 0,9761 | 0,9906 | 0,8896 | 0,9841 | 0,0882 | 0,9874 || о0ввз | 


я 1,0000 | 0,9712 | 0,9028 | 0,9892 | 0,0879 | 0,9818 | 0,0938 
> » 1,0000 | 0,8736 | 0,9708 | 0,0908 | 0,9895 | 0,0949 
ь ы * 1,0000 | 0,9133 | 0,0894 | 0,8735 | 0,1146 
а р * * 1,0000 | 0,0867 | 0,9732 | 0,1002 
я а а + * 1,0000 | 0,0874 | 0,1405 














* * * * * * 1,0000 | 0,0960 


* * |. ‚: | : ы [ $ 1,0000 
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4. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА 
ИСХОДНЫХ ДАННЫХ 


В системах распознавания лиц все начинается с построения 
базы данных. Здесь исходные изображения получают непосред- 
ственно с камеры или с других разнородных источников. Именно 
поэтому изображения, составляющие базу данных, необходимо 
предварительно обработать и нормализовать. Эти же проблемы 
приходится решать при получении каждого нового образа с каме- 
ры: распознаваемый образ должен соответствовать по своим па- 
раметрам образам исходной базы данных. 


4.1. ВЫДЕЛЕНИЕ ИЗОБРАЖЕНИЯ ЛИЦА, 
ЕГО ДЕТАЛЕЙ И ПАРАМЕТРОВ 


Наиболее трудной задачей среди перечисленных выше являет- 
ся выделение собственно лица из исходного (заданного) изобра- 
жения, а также его основных частей — 2/3 нижней части лица, 
глаз, носа и т. д. Для решения этих задач используются два извест- 
ных подхода [Прэ82, Вгу99, Реп00]. 

Первый [Прэ82] основан на просмотре всего исходного изобра- 
жения локальной маской и сопоставлении образа в поле этой маски 
с некоторым эталоном (см. разд. 2.4). Эталоном является изоб- 
ражение заданного размера, в котором человеческое лицо или его 
часть (с фотографии, например) расположено в центре, а фон в 
окружении лица соответствует фону исходного изображения. При 
этом на эталоне должно быть представлено практически фрон- 
тальное изображение лица человека. В качестве меры различия 
берется среднеквадратическая ошибка или нормированная кор- 
реляция между образом в поле маски и эталоном. Минимум сред- 
неквадратической ошибки (или максимум взаимной нормирован- 
ной корреляции), полученный в результате всего просмотра, будет 
свидетельствовать о наилучшем соответствии изображения в поле 
маски — эталону. 

Другой подход [Вгу99, Реп00] использ 
диентах яркости исходного изображения 
ния центра лица, относительно которого 
лицо. 




















ует информацию о гра- 
и процедуру вычисле- 
затем выделяется все 





4.1.1. ВЫДЕЛЕНИЕ ЛИЦА И ЕГО ЧАСТЕЙ 


Пример использования первого подхода для выделения лица 
из фотографии показан на рис. 4.1.1. В качестве эталона выбрано 
лицо человека, стоящего в центре левой фотографии, а сам эталон 
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Исходное изображение и его обработка 





Рис. 4.1.1. Выделение лиц из фотографии. Фото из пакета МАТЛАБ 


выделен квадратной рамкой. Просмотр исходного изображения 
(с помощью маски размером с эталон) начинается от некоторой 
позиции левого верхнего угла и продолжается вертикально вниз 
до момента, пока маска находится в поле исходного изображения. 
На рисунке знаками «+», выстроенными в линейку, обозначены 
позиции начала поиска. 

На каждом шаге просмотра оценивается среднеквадратиче- 
ская ошибка между образом в поле маски и эталоном. Если на 
текущем шаге просмотра ошибка меньше некоторого заданного 
порога и меньше, чем вычисленная на предыдущем шаге, то она 
записывается в «вектор ошибок», а координаты центра маски за- 
поминаются. На рис. 4.1.1 в поле лица каждого человека видны 
знаки «+», определяющие координаты центров маски, для кото- 
рых вычисленная среднеквадратическая ошибка отвечала приве- 
денным выше условиям. По окончании первого вертикального 
просмотра в векторе ошибок отыскивается «глобальный мини- 
мум», а по нему — соответствующие координаты центра маски, 
которые определяют наилучшее совмещение (привязку) изобра- 
жения в поле маски с эталоном. Полученные при этом три пара- 
метра — ошибка, координата Х (столбец исходного изображения) 
и координата У (строка исходного изображения) записываются в 
некоторый вектор результатов. ` Е 

Далее просмотр продолжается © новой верхней позиции, отсто- 
ящей от самой первой позиции на некоторую дельту А. И так 
происходит просмотр (сканирование) всего исходного изображе- 
ния, а в векторе результатов накапливается информация о тех уча- 
стках исходного изображения, которые соответствуют эталону. 

Для ускорения сканирования всего исходного изображения 
переход на новую позицию маски осуществляется скачкообраз- 
но — с некоторой А, обычно большей, чем один пиксель. Поэтому 
по окончании всего просмотра исходного изображения выполня- 
ется второй этап — локальная привязка. Она реализуется относи- 
тельно параметров, записанных в векторе результатов, с шагом 
сканирования +1 пиксель и только в пределах АД. В процессе ло- 
кальной привязки также ищется минимум ошибки (при этом 
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порогом является значение ошибки, взятое из текущей позиции 
вектора результатов), по которому и определяются окончатель- 
ные координаты интересующего нас образа. Окончательный ре- 
зультат поиска лиц по эталону приведен в правой части рис. 4.1.]. 

Несмотря на простоту, описанный подход реализует поиск об- 
раза по эталону быстро и результативно, однако требует соответ- 
ствия размеров искомого образа с размерами эталона. Поскольку 
в практике обработки заданных изображений априори нельзя га- 
рантировать такого соответствия, описанный выше процесс вы- 
полняется несколько раз, в каждом из которых исходное изобра- 
жение перемасштабируется вверх/вниз, образуя так называемую 
пирамиду изображений [Ко\'98]. Для каждого изображения пи- 
рамиды отыскиваются координаты привязки, и те из них счита- 
ются актуальными, для которых есть максимальное число совпа- 
дений этих координат на соответствующих локальных участках. 
На этом же этапе определяются актуальные размеры исходного 
изображения, привязанного к размеру эталона. 

На рис. 4.1.2 представлены некоторые варианты эталонов, ис- 
нользуемых в системах распознавания лиц, которые мы также бу- 
дем в дальнейшем использовать. Исходным является эталон, отме- 
ченный цифрой 1, т.е. фронтальное изображение лица человека. 
Его размер 112 х 92 пикселя. Все последующие эталоны получены 
из эталона 1. Номером 2 отмечен эталон, охватывающий наиболее 
информативную (индивидуальную) часть лица, а номером 3 — 
эталон, представляющий наиболее неизменяемую часть лица. Эта- 
лоны 4, 5 и 6 определяют различные детали лица. 

Покажем теперь, что метод сравнения с 
выделить интересующий нас об 
меры и пункт наблюдения в 
точно соответствуют эталону. 

В качестве исходных изображений 
из первых 10 классов базы [Ог1**], 
2 (см. рис. 4.1.2). Процесс выделе 


эталоном позволяет 
раз даже в тех случаях, когда раз- 
исходном изображении не совсем 


выберем по одному образу 
а в качестве эталона — эталон 
ния искомого образа из исход- 





Рис. 4.1.2. Варианты эталонов, используемых в системах распознавания 
лиц 
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Выделенный 
образ 


Рис. 4.1.3. Процесс и результат выделения искомого образа по заданному 
эталону 


ного изображения (первый образ из первого класса базы [Ог!**] ) 
представлен на рис. 4.1.3 с левой стороны, где знаками «+» отме- 
чены координаты центров сканирующей маски. 

С правой стороны представлен выделенный образ. Даже «на 
глаз» видно несоответствие масштабов эталона и выделенного 
образа. Разными также являются и пункты наблюдения собственно 
лица для эталона и выделенного образа. Однако и при этом хоро- 
шо видна привязка по уровню глаз. 

Эту оценку дополнит результат выделения интересующего нас 
образа из исходных изображений всех 10 классов базы [Ог!**] , 
который представлен на рис. 4.1.4а. 

А теперь в качестве эталона возьмем эталон 8 (см. рис. 4.1.2), 
а в качестве исходных изображений — все 10 образов первого 
класса базы [Ог1**]. 

Результат выделения образов, соответствующих эталону 3, пред- 
ставлен на рисунке 4.1.45. Можно оценить этот результат как 
превосходный, поскольку практически ни для одного из исход- 
ных изображений не было выполнено условие полного соответ- 
ствия с эталоном. 

Из приведенных примеров следует, что в данном подходе, исполь- 
зующим процедуру сопоставления с эталоном, не требуется точного 
соответствия параметрам эталона: рАвиеры: выделяемого образа и 
эталона могут отличаться в пределах 5 — 10 %, не требуется и строго 
фронтального образа на эталоне и исходном изображении и т. д. 

Выше мы отмечали, что фон в окружении лица на изображе- 
нии эталона должен соответствовать фону исходного изображе- 
ния с камеры. Во-первых, на практике при использовании систем 
распознаваниия такое условие не всегда выполнимо. Во-вторых, 
У людей разных национальностей уровень ясности лиц также .бу- 
дет разный: сравним, например, уровень ясности лиц у европейца 
и азиата, у европейца и афроамериканца и т. д. 
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Рис. 4.1.4а. Результат выделения требуемого об 


раза из различных исходных 
изображений 


Можно было бы использовать несколько эт. 
щих конкретные условия применения системы 
нако такой подход приводит к многократном 
нов) использованию процедуры сопоставления 
маски с эталоном и усложняет принятие ок 
ния: при разных (априори неизвестных соче 
сти образа в поле рамки исходного изображ 
различия с эталоном может быть непредс 
зованный минимаксный критерий может 
сработать. 

Рассмотрим новое и очевидное решение. Вместо 
ражения эталона будем всегда использовать матри 
тов яркости, а перед процедурой выделения лица (или его деталей) 
исходное изображение также представим в форме его градиентов 
яркости. При этом в качестве меры различия двух матриц гради- 
ентов (одна соответствует эталону, другая — образу в поле рамки 
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алонов, учитываю- 
распознавания, од- 
У (по числу этало- 
изображения в поле 
ончательного реше- 
таниях фона и ясно- 
ения) мера подобия/ 
казуемой и исполь- 
не всегда достоверно 


обычного изоб- 
цу его градиен- 

















Рис. 4.1.4Ъ. Результат выделения требуемого образа из исходных изображений 
одного и того же класса образов базы [Ог1**] 








о на исходном изображении) необходимо использовать или метрику 
ных Г: (сумму модулей разностей между ними), или метрику [Г4. 

На рис. 4.1.5а приведено изображение эталона 1 (представлен- 
ного ранее на рис. 4.1.2) и два изображения, соответствующие 


ох 
1 





и ОР Рис. 4.1.5а. Эталон и представление его в форме градиентов 
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Рис. 4.1.5Ъ. Выделение образа лица из исходных изображений с различным 
фоном при использовании одного и того же эталона 


различным способам вычисления градиентов яркости эталона. 


Среднее изображение получено в результате суммирования гра- 
диентов яркости эталона по оси Х и оси Уз 


04 = << + С9 й 


где С и б® _— градиенты яркости по оси Х и оси №: 


Правое изображение вычислено как корень квадратный из сум- 
марной энергии градиентов: 


0(2) хх Усе @®) $ сс) ч 


На рис. 4.1.55 приведены: в верхней части рисунка исходное 
| изображение с черным фоном, градиенты яркости исходного изоб- 

ражения и выделенное изображение лица; в нижней части рисун- 
ка — исходное изображение с белым фоном, градиенты яркости 


| исходного изображения и выделенное изображение лица. На ис- 
ходных изображениях эллипсами очерчены области, в которых 
найдено лицо человека. 











4.1.2. ОПРЕДЕЛЕНИЕ РАССТОЯНИЯ 
МЕЖДУ ЦЕНТРАМИ ГЛАЗ 





Решим теперь практическую задач 
|| между центрами глаз на изображении лица, полученном вое. 

редственно с камеры. Зная это расстояние, можно, например, опре- 
делить ось симметрии лица, а также перемасштабировать образ 
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Рис. 4.1.6. Процесс и результат определения расстояния между центрами глаз 


лица до требуемых размеров. Последняя операция часто исполь- 
зуется при распознавании человека по лицу, в том числе для точ- 
ной идентификации человека, поскольку расстояние между цент- 
рами глаз — один из антропометрических параметров лица. 

Для решения поставленной задачи в автоматическом режиме 
сначала выделим собственно изображение лица из исходного изоб- 
ражения с камеры, используя эталон 1, затем с использованием 
эталона 3 выделим часть лица и, наконец, используя эталоны 4, 
найдем центры регионов глаз и оценим расстояние между ними. 
Середина между центрами глаз — есть ось симметрии образа лица, 
если, правда, образ лица имеет строго фронтальный вид. В дан- 
ном случае мы используем именно фронтальный вид лица. 

Процесс и результат решения поставленной задачи показаны 
на рис. 4.1.6. 

При этом исходное изображение с камеры имело размер 
240 х 320 пикселей. Эталон 1 (и соответственно ему образ выде- 
ленного лица) имеют размеры 112 х 92 пикселя. Выделенное лицо 
было увеличено в два раза и стало иметь размер 224х 184 пиксе- 
ля. Эталон для выделения средней части лица имел размер 88 х 120 
пикселей. Эталоны глаз (приведены на рисунке) имели размеры 
22х 33 пикселя. 

Вычисленные центры регионов глаз показаны знаком «+» на 
выделенной средней части лица. Несмотря на то, что на лице име- 
лись очки, центры глаз определены достаточно точно. Затем эти 
центры были «перенесены» на образ целого лица. При этом вычис- 
ленное расстояние между центрами глаз составило 58 пикселей. 
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Ось симметрии лица показана вертикальной линией на ниж. 
нем левом изображении рис. 4.1.6, и, как видно, она определена 
достаточно точно. 


4.1.3. ВЫДЕЛЕНИЕ ИЗОБРАЖЕНИЯ ЛИЦА 
ГРАДИЕНТНЫМИ МЕТОДАМИ 


Напомним, что при этом подходе используется информация о 
градиентах яркости исходного изображения и процедура вычис- 
ления центра лица, относительно которого затем выделяется все 
лицо. 

Центр лица определяется следующим образом. Пусть левое 
изображение на рис. 4.1.7а является изображением с камеры. 
Вычислим градиенты яркости (отдельно по оси Х и оси У) всего 
исходного изображения. Поле совместных по оси Х и оси У гра- 
диентов яркости представлено на рис. 4.1.7а с правой стороны. 

Сформируем некоторую нулевую матрицу (матрицу центров 
лиц — МЦЛ) размером с исходное изображение. 

Далее просмотрим все градиентное поле пиксель за пикселем. 
Если в текущем пикселе (1,7) градиент превышает некоторый по- 
рог, то в предположении, что лицо может быть описано кругом 

радиуса В, вычисляются новые координаты (т,п), отстоящие от 
координат (1,]) на этот радиус и по адресам координат (т,п) в 
МЦЛ добавляется «1». 

Если следовать по градиентам овала лица, то наибольшее чис- 
ло единичек в МЦЛ будет записано в координатах, соответствую- 
щих центру лица, и близко к нему, в то время как единички всех 
симметричных новых координат будут распределены равномерно 
за регионом лица, повторяя его овал. 

На рис. 4.1.7Ь в левой части представлен вид МЦЛ в 3ЗО-фор- 
ме. Цифрами 1 и 2 обозначены пики, находящиеся на месте цен- 
тров лиц. 





Рис. 4.1.7а. Исходное изображение и его представление в поле градиентов 
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Представление МЦЛ в форме 32 Результат выделения лица 
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Рис. 4.1.7Ь. Результат выделения региона лица на изображении с камеры 


Поскольку лицо № 1 было ближе к камере, имело более пра- 
вильные формы и вокруг него не было значительного изменения 
фона (такого, который имеется вокруг лица № 2), то пик 1 на 
МЦЛ имеет большую высоту по сравнению с пиком 2. Применяя 
далее пороговую селекцию, можно выделить только пик 1. Центр 
этого пика отмечен на правом изображении рис. 4.1.7 крестиком. 
Относительно этого центра можно теперь выделить интересую- 
щее нас изображение лица. 

На МЦЛ можно также заметить и другие пики, овалы и линии, 
сопоставляя которые с изображением в форме градиентов, неслож- 
но определить их принадлежность исходному изображению. 

Заметим, что на самом деле овал лица не всегда имеет форму 
круга. Он традиционно ближе к эллипсу, поэтому перед вычисле- 
нием градиентов исходное изображение перемасштабируется — 
увеличивается по ширине на 20-25 %. В конце вычислений выпол- 
няется обратная операция с тем, чтобы центр выделяемого лица 
соответствовал масштабу реальной сцены, полученной с камеры. 

Несмотря на относительную сложность описанного подхода, его 
применяют для выделения центров лиц на групповых фотогра- 
фиях людей, а также для выделения центров деталей лиц — глаз, 
носа, рта. Примеры использования этого подхода для выделения 
деталей лиц можно найти в обзоре [Вгу99, Реп00]. 


4.2. СОГЛАСОВАНИЕ РАЗМЕРОВ ИЗОБРАЖЕНИЙ 


При практическом решении задач распознавания образов лиц 
мы постоянно сталкиваемся с необходимостью изменения разме- 
ров изображений. Эта же необходимость возникала (см. гл. би 
начало гл. 6) при согласовании размера контрольного или выде- 
ленного изображения до требуемого; при построении пирамиды 
изображений из единственного исходного изображения; при по- 
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лучении требуемых антропометрических характеристик лица и 
их «привязки» к заданным размерам на эти характеристики. 
Сама задача изменения размера некоторого изображения не вызы. 
вает практических трудностей, поскольку необходимыми для этого 
процедурами (и заметим, высокого качества!) оснащены все существу- 
ющие графические и математические пакеты, используемые как сред- 
ства обработки данных в задачах распознавания. Вопрос стоит не как 
сделать, а в какую сторону (увеличить или уменьшить) и на сколько 
(пикселей, процентов или по отношению, например, ширины к высоте) 
требуется изменить размер заданного изображения. 

Если же говорить о качественной стороне изменения размера 
изображений, то в наших системах она достигается использовани- 
ем процедур «Пигез1те» из Тоофох’а Ппаве Ргосезз1пе пакета 
МАТГАВ [Пот99, Руд00]. 

На рис. 4.2.1 приведена структурная схема простого алгорит- 
ма согласования размера выделяемого образа с использованием 
параметра А — расстояния между центрами глаз. 

Исходным здесь является изображение с камеры, а выделяе- 
мый образ — средняя часть лица. Необходимо выбрать такой раз- 
мер выделяемого образа, для которого расстояние между центрами 
глаз будет равно величине 5 с ошибкой не большей некоторой 5. 

Если изображение с камеры имеет размер 240 х 320 пикселей, а 
изображение всего лица размещено в рамке 112 х 92 пикселя, то 
параметр 6 обычно выбирается равным 1. 

Первая оценка расстояния В между центрами глаз дается в 
соответствии с методом, представленным выше. На этом же эта- 
пе вычисляется положение оси симметрии лица, относительно 
которого будет формироваться новая рамка, а в ее поле выбирать- 

ся новое изображение лица. Таким образом, эталон 1 использует- 
ся только один раз — при первой оценке величины ВЮ. Результа- 
ты первого вычисления расстояния В для трех разных изображе- 
ний с камеры представлены на рис. 4.2.2. 

Второй и третий случай здесь отличаются от первого сильным 
приближением и соответственно удалением лица от объектива 
камеры. 

Нормальное положение лица у объектива каме 
ет первому случаю, при котором В=5=29. 

Заметим, что хотя во втором случае первый выбор изображения 
лица был не совсем удачным (образ не отцентрирован в поле рам- 
ки), тем не менее центры глаз определены достаточно точно. При 
этом расстояние между центрами глаз составило В = 33 пикселя. 

Размеры всех последующих новых изображений лиц будут 
определяться размерами новой рамки. Для приведения получен- 
ных при этом изображений к размеру 112 х92 пикселя далее 
используется процедура перемасштабирования. Таким образом, 
изменяя размер рамки и выбирая с ее помощью изображение лица 
(большее или меньшее) из исходного изображения и перемасшта- 
бируя его, можно согласовать требуемые размеры. 


ры соответству- 
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Рис. 4.2.1. Алгоритм согласования размера выделяемого образа 














































Рис. 4.2.2. Процесс и результаты вычисления расстояния между центрами глаз 


А теперь опишем представленный алгоритм подробней. 

Если выполняется условие (В-5)> 5, то это означает, что вы- 
бранный образ имеет больший, чем требуется, размер. В этом слу- 
чае представленный алгоритм реализуется по левой группе бло- 
ков (см. рис. 4.2.1). 


При этом устанавливается в 0 признак ФЛАГ и вычисляется 


раз перемасштабируется к размеру 112 х 92 
вычисляется новое значение параметра В. 
Если не выполняется условие абз(В — 5) <5, то значение пара- 
метра ДР увеличивается на 2 и описанный выше цикл повторяет- 
ся. В противном случае признак ФЛАГ становится равным 1, и 
далее следует выход из процедуры согласования. 
Если не выполняется условие (В — 5) > 5, то, возмо 
няется условие (5 — В) > 9. Это означает, что выбранны 
меньший, чем требуется, размер. В этом случае алго 
зуется по правой группе блоков (см. рис. 4.2.1). п 


пикселя и для него 





Далее, до 


тех пор пока признак ФЛАГ остается равным 0, происходит 
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уменьшение размеров 
поля рамки на величи- 
ну О, и из исходного 
изображения выбирает- 
ся новый образ лица. 
Этот образ перемас- 
штабируется к размеру 
112 х92 пикселя и для 
него вычисляется новое 
значение параметра В. 

Если не выполняется 
условие а65(5-—В) < 5, то 
значение параметра О 
увеличивается на 2 и 
описанный выше цикл 
повторяется. В против- 
ном случае признак 
ФЛАГ становится рав- 
ным 1 и далее следует 
выход из процедуры со- 
гласования. 

Естественно, что, ис- 
пользуя один и тот же 
эталон (в данном случае, 
эталон 1) для изображе- 
ний с камеры, получим 
из них изображения 
лиц разных масштабов. 
Это отчетливо видно во 
второй колонке рис. 4.2.2, где выделена рамка, соответствующая 
размеру эталона 1. 5 

Результаты согласования размеров изображений, отвечающих 
заданному параметру $ = 29 и значению 5=1, представлены на 
рис. 4.2.3. Первая колонка здесь представляет промежуточный 
результат — перемасштабированные к размеру 112 х92 пикселя 
изображения целого лица, из которых затем выбирались изобра- 
жения средней части лиц (вторая колонка) и по которым оцени- 
валась величина В. ы 

Заметим, что все три изображения в левой колонке хорошо 
отцентрированы в поле рамки. 

Следуя описанному выше алгоритму согласования размеров, 
получаем практически одинаковые изображения средней части 
лица для всех трех случаев (см. рис. 4.2.3). Расстояния между 
центрами глаз здесь составляют 29, 30 и 29 пикселей. 








Рис. 4.2.3. Результаты согласования размеров 
выбираемых изображений с камеры 
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4.3. НОРМАЛИЗАЦИЯ ОБРАЗОВ 


Под нормализацией образов в данном случае будем подразу- 
мевать их приведение к некоторому стандартному виду. В неко- 
тором смысле согласование размеров изображений, рассмотрен- 
ное выше, тоже является их нормализацией. 

Кроме упомянутого согласования размеров изображений в рам- 
ках нормализации можно, например, элиминировать повороты и 
наклоны изображений лица (!) во фронтальной и продольных плос- 
костях, изменить яркость и контраст исходного изображения и 


даже частично или полностью изменить его способ и условия ос- 
вещения. 


Ниже остановимся на некоторых процедурах нормализации. 


4.3.1. ЭЛИМИНИРОВАНИЕ ПОВОРОТОВ 


Чрезвычайно редко можно увидеть лицо человека на фотогра- 
фии, где изображение собственно лица ориентировано строго впе- 
ред, а ось симметрии лица находится в строго вертикальном по- 
ложении. Чаще всего при этом лицо слегка повернуто, как и го- 
лова, вверх/вниз или вправо/влево и имеет тот же наклон в сторону 
плеч, что и голова. Поворот головы (например, вверх/вниз или 
вправо/влево хотя бы в пределах +15°) в момент съемки лица 
камерой приводит к значительным изменениям его изображе- 
ния: нарушению основных его пропорций, и, как следствие этого, 
изменению характеристик признаков и соотношений антропомет- 
рических параметров. Это становится особенно заметным на цен- 
тральной части изображения лица (см., например, рис. 4.1.4), что 
не позволяет принимать ее в данном случае за наиболее инфор- 
мативную часть разпознаваемого образа. 

С теоретической точки зрения, проблема элиминирования (учета, 
компенсации) поворота головы на изображениях лиц решена. При 
этом используются два основных подхода, представленные в рабо- 
тах [А9197, АМ99, Веп98, Све94, Каг98, Кис99, Тап97, Тат 98, $199, 
'Тра98, Уе{97]: путем выделения признаков, являющихся инвариан- 
тами поворотов, либо путем составления виртуальных моделей лиц. 

Первый подход [А99, Кис99] реализуется путем вычисления 
контуров лиц, их проецирования на плоскость ХУ, нормирования и 
выравнивания масштабов контуров по осям Х и У, а также исполь- 
зования инвариантов типа АЁЁше Атс Теп2®, Епс]озеа Агеа, ОМТ, и 
др. При этом далее в процессе распознавания используются только 
эти инварианты. Второй подход — синтез виртуальных моделей 
лиц — может быть реализован несколькими способами. Об одном 
из них — эластичных моделях лиц [Гап97, 51199] — мы уже вспо- 
минали в разд. 2.3.6. Рассмотрим еще два новых подхода. 

В первом из них [Веп98, Све94] определяются углы — пара- 
метры (азимут — угол поворота головы влево/вправо и элева- 
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‚› реконструкции ново- 
го положения головы на основе базовых моделей, вычисленных 
углов и синтеза нового изображения лица. Синтез осуществляет- 
ся либо на основе обратного преобразования Фурье—Меллина мо- 
дифицированных в соответствии с вычисленными углами спект- 
ров, либо на основе подбора базовых моделей лиц, отвечающих 
вычисленным углам—параметрам поворотов. 

Синтез виртуальных моделей [Т.ат98, Тра98, \Уе{97] лиц осно- 
ван на сравнении значений признаков заданного изображения со 
значениями признаков эталонного изображения лица (например, 
для изображения строго в фас), согласовании (замене) необходи- 
мых параметров и реконструкции нового изображения лица с уче- 
том измененных параметров. Для успешного решения этой задачи 
необходимо прежде всего иметь не менее девяти эталонных изоб- 
ражений лиц в каждом классе: фас, поворот влево, поворот вправо, 
поворот вверх, поворот вниз и еще, по крайней мере, четыре совме- 
стных поворота — вниз и влево, вниз и вправо, вверх и влево и 
вверх и вправо. Далее необходимо так выбрать пространство ис- 
ходных признаков и так его редуцировать, чтобы хотя бы два при- 
знака редуцированного пространста признаков «отвечали» за по- 
ворот лица: один за поворот влево/вправо, другой за поворот вверх / 
вниз. При этом другие признаки должны «отвечать» за индивиду- 
альные особенности каждого класса образов. После этого можно 
привести интересующие нас два признака анализируемого образа 
к средним значениям, не меняя остальные, что будет соответетво- 
вать изображению лица, полученному строго в фас, но сохранивше- 
му индивидуальные особенности класса. Далее обычным путем 
завершается решение задачи классификации, а если требуется, то 
на основе обратных преобразований (например, Карунена— Лоэва) 
по новым признакам реконструируется новое изображение лица. 
При этом, если изменять значения признаков, отвечающих за ин- 
дивидуальные особенности класса, то можно от образа лица одного 
класса перейти к образу лица другого класса. А поскольку такого 
изображения (такого конкретно образа) могло в базе не быть, по- 
добный образ и называется виртуальным. 

Заметим, что ввиду сложности представленных процессов эли- 
минирования поворотов головы на изображениях лиц эта пробле- 
ма не нашла широкого практического применения в системах рас- 
познавания «оп-Ппе». 

Однако, если система «оп-Ипе» все же ориентирована на рас- 
познавание лиц с учетом поворотов головы, то реализуется это за 
счет наполнения базы данных, которая должна содержать в каж- 
дом классе необходимое множество образов, соответствующих раз- 
личным поворотам. Примером может служить база данных [Ог**], 
хотя и здесь упомянутое выше требование выполнено не для всех 
классов образов. 
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4.3.2. ЭЛИМИНИРОВАНИЕ НАКЛОНОВ 






В системах распознавания «оп-Нпе» элиминирование накло- 
нов лица на изображениях не всегда необходимо. Малые Углы 
наклона система ‘распознавания вообще не должна как бы заме. 
чать — быть по отношению к ним робастной и, следовательно, не 
должна затруднять процесс распознавания и ухудшать его каче- 
ство. При больших углах наклона, например больших чем 30°, 
необходимо просто сообщить пользователю о непригодности ис- 
ходного изображения и повторить съем нового изображения с 
камеры. : 

Проанализируем теперь примеры, для которых возможно точ- 
ное определение угла наклона головы простыми методами. Далее 
опишем эти методы и приведем конкретные результаты элими- 
нирования наклонов в системе ‹оп-Ппе». 

На рис. 4.3.1 приведены два типичных варианта наклонов лиц, 
полученные с исходных изображений непосредственно с камеры. 
Ясно, что они не пригодны для распознавания, хотя наибольший 
угол наклона здесь 20°. 

Более того, если оценивать расстояния между центрами глаз 
по выделенным частям лиц, то не исключены существенные ошиб- 
ки в оценках: во-первых, эти расстояния будут меньше, чем ре- 
альные, а во-вторых, для их корректировки необходимо будет учесть, 

в какую из сторон был выполнен наклон головы — влево или 
вправо. Неверное же определение оси симметрии лица не позво- 
лит точно центрировать выделяемый образ в поле рамки, что так- 


| же осложнит весь процесс распознавания и повлияет на его ре- 
|| зультат. : 


| Обозначим центр левого (по отношению к нам) глаза цифрой 
| `1, а центр правого (также по отношению к нам) глаза цифрой 2 и 
обозначим параметры, которые необходимо знать, чтобы вычис- 











лить угол наклона головы. 
| Для этого выполним построение взаимного расположения глаз 
для двух типичных вариантов наклона (рис. 4.3.2), где В — рас- 
стояние между центрами глаз, р — расстояние между высотами 
центров глаз, 0 — оцениваемый угол. 














Наклон лица вправо Г Наклон лица влево 











Рис. 4.3.1. Два типичных варианта наклонов лиц на исходных изображениях 
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Рис. 4.3.2. Определение величин Е, Д и 6 для поворотов лица во фронтальной 
плоскости: а — поворот лица вправо; Б — поворот лица влево 


Легко заметить, что угол 
р 
0 = агсё — 4.1 
ЕЕ (4.1) 


и может принимать значения как отрицательные (что соответ- 
ствует повороту головы вправо), так и положительные (что соот- 
ветствует повороту головы влево). 

Оценим теперь абсолютную величину угла 0 в зависимости от 
значений величины ШО, приняв, например, что расстояние между 
центрами глаз В =30 пикселей. Такое расстояние соответствует 
изображению лица размером 112 х92 пикселя, в котором соб- 
ственно лицо размещено в поле всего изображения. 

Зависимость угла 0 от величины ДО при фиксированном значе- 
нии В = 30 показана на рис. 4.3.3. Из него видно, что для исходных 
изображений размером 112 х 92 пикселя угол 0 = 20° практически 
получается уже при разнице в высотах центров глаз Д = 10 пиксе- 
лей. Угол < 5°, который можно не учитывать и, соответственно, не 
элимировать, соответствует значению О, равному 2 пикселя. 

Оцененные граничные значения ДР могут служить в дальней- 
шем критерием для принятия решения об элиминировании на- 
клонов головы в реальных ситуациях. 





— 
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Рис. 4.3.3. Зависимость угла 6 от величины О 
при фиксированном значении В=30 
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Рис. 4.3.4. Процесс вычисления углов 6 и нормализации изображений 


Весь процесс вычисления углов 0 и нормализации изображе- 
ний лиц показан на рис. 4.3.4. Заметим, что для правильной нор- 
мализации (поворота изображений в плоскости ХУ) используется 
угол со знаком, противоположным вычисленному. 

В первом случае (см. рис. 4.3.4) угол 0 составил 11°, а поворот 
исходного изображения с камеры был выполнен для 09'=-11°. Во 
втором случае угол 0 составил соответственно —23 и 23°. 

На рис. 4.3.4 цифрами 1 отмечены исходные изображения, по- 
лученные с камеры. На них рамками обозначены регионы, в кото- 
рых были обнаружены методом сопоставления с эталоном, описан- 
ным выше, образы лиц. В обоих случаях использовался один и тот 
же эталон № 1 (см. рис. 4.1.2). Цифрами 2 отмечены изображения 
выделенных лиц, из которых затем с помощью эталона №3 
(см. рис. 4.1.2) были получены изображения средней части лиц. 
По ним с использованием эталонов глаз определялось положение 
левого и правого глаза, вычислялись центры глаз и далее опреде- 
лялся угол наклона линии глаз относительно горизонта ли. Таким 
образом определялись значения углов поворота 0. 

Цифрами 2 и 3 отмечены соответственно исхо 
ние с камеры и результат его поворота на угол 
выполнении поворота изображения в плоскос 
как правило, увеличивается, необходимой ст 
выбора из его центральной части нового изобр 
соответствующего изображению 1. Это выбр 
отмечено цифрой 3. Окончательный результат 
ставлен изображениями под номерами 4. Нормализованные (от- 
носительно наклона головы) изображения получены из изобра- 
жения 3 с помощью эталона № 1. На изображении 3 в Вам е 
выделено поле, в котором среднеквадратическое отклонение от 
эталона было наименьшим. 


дное изображе- 
—9. Поскольку при 
ти ХУ его размер, 
ановится операция 
ажения по размеру, 
анное изображение 
нормализации пред- 
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Из представленных результатов видно, что нормализация про- 
шла успешно: выделенные изображения лиц достаточно хорошо 
отцентрированы в поле рамок (размером 112х92 пикселя) и в 
них элиминирован первоначальный наклон головы. 

Дальнейшая обработка полученных изображений в системе «оп- 
Пре» не должна вызывать практических трудностей. 

Используя теперь в качестве исходных изображения, отмечен- 
ные цифрой 4а и 46, можно приступить к процедуре согласования 
их размеров, вычислить расстояние между центрами глаз, выде- 
лить все необходимые классы подобразов, а затем перейти к про- 
цедуре нормализации выделенных изображений по яркости. Эта 


последняя процедура нормализации изображений будет описана 
в следующем разделе. 


4.3.3. НОРМАЛИЗАЦИЯ ЯРКОСТИ ИЗОБРАЖЕНИЙ 


В некоторых системах распознавания «оп-Ппе» в качестве ка- 
мер, предназначенных для получения исходных изображений, ис- 
пользуются видеокамеры не очень высокого качества (например, 
предназначенные для видеоконференций). Главная проблема, воз- 
никающая при этом, — нестабильность яркостных параметров изоб- 
ражения: яркость и контраст изображения полностью зависят от 
окружающего (наружного) освещения. 

Другая проблема возникает в том случае, когда исходные изоб- 
ражения лиц людей из разных классов собирались в базу данных 
из различных источников и имеют, естественно, разные уровни 
яркости, контраста и прорисовки отдельных деталей на участках 
в области лиц и окружающего их фона. 

Нестабильность или различие в уровнях яркости становятся осо- 
бенно опасными для методов распознавания, в которых исходными 
признаками являются значения пикселей. И хотя в таких методах 
с помощью яркости выявляются форма и детали образа (например, 
овал лица, форма рта, бровей, глаз), система будет скорее реагиро- 
вать на подобие в освещении некоторого эталона и исходного изобра- 
жения, чем на подобие в деталях лиц. 

Чтобы избавиться от такого нежелательного эффекта, дистри- 
бьюторы систем распознавания «оп-Мпе» рекомендуют, например, 
записывать в базы данных образы при различном наружном ос- 
вещении: естественном днем и вечером, с использованием допол- 
нительного искусственного освещения и т. д., а также локально 
(под каждый образ) подбирать чувствительность камеры в момент 
сеанса с системой распознавания. Смысл такой рекомендации — 
иметь в базе данных эталоны «на все возможные случаи» (1 и, 

возможно, нивелировать яркость как существенный признак при 
распознавании. 

Одним из методов улучшения таких изображений является 
видоизменение гистограммы [Прэ82] — преобразование яркостей 
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исходного изображения так, чтобы гистограмма распределения 
яркостей выходного изображения приняла желаемую форму. При- 
менительно к задачам распознавания лиц конкретные рекомен- 
дации для реализации этого и других методов можно найти в 
работах [Аа197, А14{99, Гап97, Тза98]. 

На рис. 4.3.5 с левой стороны представлены два изображения, 
снятые с камеры в различных условиях освещения. На верхнем, 
более темном, изображении в поле рамки едва различимы детали 
лица. На нижнем изображении, полученном при более или менее 
нормальном освещении, детали лица в поле рамки различаются 
значительно лучше. 

Однако как оценить, достаточно ли качество этого нижнего изоб- 
ражения для задач распознавания и не нужно ли (и можно ли) его 
еще улучитить. Обратим внимание на гистограммы, соответствую- 
щие изображениям, находящимся в поле рамок. Как видно, гисто- 
грамма распределения яркостей верхнего, более темного, изображе- 
ния «сдвинута» влево (не использован диапазон уровней начиная 
со 150 и до 255), в то время как гистограмма нижнего лучшего 
качества: она занимает практически весь диапазон яркостей. Од- 
нако видно, что и здесь не полностью использован диапазон ярко- 
стей на уровнях от 0 до 25. 

При недоиспользовании диапазона высоких уровней яркости 
получается слишком темное изображение, в котором трудно во- 
обще выделить детали лиц, в то время как при неиспользовании 
диапазона низких уровней яркости границы черного и белого то- 
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Рис. 4.3.5. Изображения с камеры и гистограммы расн 
ных образов 
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Рис. 4.3.6. Изображение после обработки и его гистограмма распределения ярко- 
стей 


нов становятся нерезкими, отдельные детали лиц остаются непро- 
рисованными и т. д. 

Изменим яркость нижнего изображения (в рамке) так, чтобы 
гистограмма распределения яркостей занимала весь диапазон от 
О до 255. Результат такого изменения изображения и соответ- 
ствующая ему гистограмма представлены на рис. 4.3.6. Хотя «на 
глаз» не видно существенных изменений в целом на изображе- 
нии, но при детальном рассмотрении лица можно заметить, что 
изменения есть. 

В автоматическом режиме подобная операция нормирования 
яркости изображения реализуется следующим образом: 


С; [= 255(7,, арт Я )/( шах м Яша)» (4.2) 


где 7,, — пиксель исходного изображения, 1 = 1, 2,..., Ми] =1,2, ..., 
М; М, № — размеры изображения; „и — минимальное значение 
яркости исходного изображения; Й„„х — максимальное значение 
яркости исходного изображения; С\, — пиксель изображения с ви- 
доизмененной гистограммой. 

В некоторых случаях, связанных с обработкой исходных изоб- 
ражений, полученных из разнородных источников, перед норми- 
рованием (4.2) исходное изображение центрируется относитель- 
но своего среднего значения и нормируется на среднеквадрати- 
ческое отклонение от среднего. 

В системах распознавания «оп-Йпе» операцию (4.2) нормирова- 
ния необходимо применять дважды: первый раз непосредственно 
к исходному изображению, полученному с камеры, что создаст луч- 
шие условия работы блоков выделения изображений по эталонам; 
второй раз — к выделенному изображению, поскольку оно являет- 
ся локальным по отношению ко всему исходному изображению и 
в нем не использован весь диапазон изменения яркости. 

Результат нормализации (4.2) исходных изображений, получен- 
ных с камеры в различных условиях наружного освещения, пред- 
ставлен на рис. 4.3.7. 
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Рис. 4.3.7. Нормализация яркости изображений, 
полученных с камеры 





























Рис. 4.3.8. Результаты нормализации яркости по двухэтанной процедуре 
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Рис. 4.3.9а. Изображения, полученные из разнородных источников и при разных 
условиях освещения в момент съемки 





Рис. 4.3.9Ъ. Результаты нормализации яркости для изображений базы данных, 
полученной из разнородных источников 


139 





Если для верхнего изображения нормализация яркости, возмож- 
но, и не была необходимой, то для двух нижних изображений она 
дала значительный эффект и, стало быть, была остро необходима. 

А теперь проверим, насколько обязательным становится выпол- 
нение второй нормализации после выделения изображения лица. 
Выберем такой уровень наружного освещения, при котором уже 
после выполнения первой нормализации выделенное изображение 
лица имело бы достаточную яркость. Далее построим гистограм- 
му распределения яркости этого изображения, нормализуем его и 

построим новую гистрограмму. Сравнивая две гистрограммы, оце- 
ним необходимость выполнения второй нормализации. 

Результаты эксперимента, выполненного по двухэтапной про- 
цедуре нормализации яркости, представлены на рис. 4.3.8. 

Здесь изображения 1 и 2 — исходные, полученные с камеры и 
нормализованные по яркости. Изображение 8 — результат выде- 
ления из поля рамки по изображению 2. Изображение 4 получе- 
но из изображения 3 путем нормализации его по яркости. Верх- 
няя гистограмма относится к изображению 3, а нижняя соответ- 
ственно к изображению 4. Как видим, этот пример, в частности, 
убедительно показывает необходимость двухэтапной процедуры 
нормализации изображений для систем распознавания «оп-Йпе». 

Целью дальнейшей нормализации яркости рассматриваемого 
класса изображений должно стать подчеркивание границ форм 
лица: его овала, границ рта, глаз, бровей и т. д. Для этого можно 
воспользоваться известными методами [Пре82], основанными, на- 
пример, на локальных методах обработки изображений. 

В заключение настоящего раздела представим результаты нор- 
мализации яркости изображений (из базы данных), полученных 
из разнородных источников. На рис. 4.3.9а представлены исход- 
ные изображения, на рис. 4.3.95 — изображения, полученные в 
результате нормализации. Сравнение результатов говорит само 
за себя и в пользу нормализации. 

Еще раз подчеркнем: качество распознавания образов в огром- 
ной степени зависит от качества самих образов. Именно поэтому 
улучшению качества образов, предназначенных для распознава- 
ния, необходимо уделить особое внимание. Все процедуры пред- 
варительной обработки изображений, рассмотренные в настоящем 
разделе, призваны способствовать улучшению их качества, а так- 
же наилучшему выделению признаков вообще или биометриче- 
ских признаков в частности. В связи с этим в рассматриваемые 
ниже системы распознавания включен (как обязательный) блок 
предварительной обработки изображений. 











5. СИНТЕЗ СИСТЕМЫ РАСПОЗНАВАНИЯ 
ДЛЯ СТРУКТУРИРОВАННЫХ ДАННЫХ 


Под структурированными данными б 
сгруппированные в классы. В данном сл 


ных — изображения лиц одного и того же человека. А поскольку 
эти данные сгруппированы, то каждое изображение лица являет- 
ся образом в классе. В общем случае число образов в каждом 
классе может быть разным, но для упрощения последующего из- 
ложения примем, что мы имеем дело с базами, в которых число 
образов в каждом классе одинаковое. Пример таких данных — 
база [Ог!**]. 

Под синтезом системы распознавания будем подразумевать: 
некоторый процесс, в ходе которого выполняется: 

® разделение исходных данных на обучающую и контрольную 
группы; 

® выбор признаков исходного пространства признаков; 

® редукция пространства признаков и анализ результата клас- 
теризации в редуцированном пространстве признаков; 

® реализация основной процедуры распознавания контрольных 
образов; 

® анализ качества распознавания контрольных образов и их 
модификаций (наложение шума, масштабирование); у 

® анализ качества распознавания контрольных образов, не при- 
надлежащих собственной базе данных; 

® выбор параметров, обеспечивающих 100 %-ное распознава- 
ние контрольных образов. : 

Предлагаемая методика синтеза основана на подходах, пред- 
ставленных в разд. 2.4 и имеющих наивысшее качество распоз- 
навания (анализ соответствующих показателей качества смотри 
там же). Общий вид структурной схемы синтеза системы распоз- 
навания для структурированных данных представлен на рис. 5.1.1. 


удем понимать данные, 
учае каждый класс дан- 


5.1. АВТОМАТИЧЕСКОЕ РАЗДЕЛЕНИЕ ДАННЫХ 
НА ОБУЧАЮЩУЮ И КОНТРОЛЬНУЮ ГРУППЫ 


Итак, мы имеем исходную базу данных с числом классов. К и 
числом @ образов в классе. Каждый образ имеет размер Мх М 
пикселей. Для синтеза системы распознавания необходимо вы- 
полнить следующие этапы (помечены знаком «точка»). 

® В каждом классе вычисляем средний образ 


[е 

— Е, ра 

0%, = Хо о. а (5.1.1) 
9=1 


а 
и отклонение Д(9) от среднего О® у для каждого образа в классе 


141 





ИСХОДНАЯ БАЗА ДАННЫХ 
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Рис. 5.1.1. Структурная схема синтеза системы 
распознавания 


2 
Аа) = [05% -0В] › пав ыю. 512 


® Далее отсортируем значения Л(4) в порядке их БАНК 
что (1) > А(2) > А(3) > ..., и переупорядочим образы каждого Аба 
исходной базы данных в соответствии с новыми порядк аня 
рами отклонений. Назовем представленную таки 
образов «виртуальной базой». 

» Выберем первые Г, образов каждого класса 
(@-1Г)>1 в виртуальной базе (ВБ) для синтеза (построения /обу- 
чения) системы распознавания, а оставшиеся (@ — Г) о той 
для контроля распознавания. 

Структура и параметры первой части ВБ представлены на 
рис. 5.1.2 слева, а второй части ВБ — справа. 3 


десь К — число 
классов; Г, — чиело образов для обучения; М, М — размеры образа. 


м образом базу 


(причем < би 
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Рис. 5.1.2. Структура виртуальной базы 
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Рис. 5.1.3. Порядок следования образов одного и того же класса в исходной 
(верхний ряд) и виртуальной базе данных (нижний ряд) 


На рис. 5.1.3 в верхней части размещены образы одного из 
классов исходной базы данных [011**], а в нижней — образы того 
же класса данных в виртуальной базе. Видно, что в ВБ последние 
четыре образа (под номерами 2, 9, Ти 4) имеют наименьшие изме- 
нения, например в повороте головы, и, очевидно, наиболее близки 
к среднему образу в данном классе. 


5.2. ОТБОР ПЕРВИЧНЫХ ПРИЗНАКОВ 
И ИХ РЕДУКЦИЯ 


Исходные признаки образа — его яркость, т. е. значение каж- 
дого пикселя. Пространство всех признаков для ВБ имеет размер 
К1[(ММ) элементов. Цель настоящего раздела — представление 
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процедуры отбора первичных признаков и их редукции. В основе 
этих процедур лежат методы анализа главных компонент (РСА) 
и преобразования Карунена—Лоэва (ПКЛ, англ. КГТ). 

Для реализации поставленной задачи выполним следующие 
шаги [Реп00, Тза98]. 

® На основе всех образов из первой части ВБ определим «сред- 
ний образ»: 


4 1 у 
Омхм === >.>,0. (5.2.1) 


® Вычислим матрицы ковариаций Емхм и Сухм, из которых 
первая определяется относительно строк каждого центрирован- 
ного образа, а вторая — относительно столбцов [Тза98]: 


1х2 о т 
мкм = ня Ве = бан о, = 2 ; (5.2.2) 


й К Г их т Е 
Сыыы тк >, [0 - вы ры быв |. (5.2.3) 


® Для каждой из матриц (5.2.2) и (5.2.3) определим собственные 
числа и соответствующие им собственные векторы, для которых 
выполняются условия 


т 
Ам = бы | ВызмУ в 
т (5.2.4) 

АО = [$ | мо : 


где (Е) и (с) — диагональн! 

Мхм №хм —Д ые матрицы, 
размещены соответствующие «строчному и 
лению» образов собственные числа; 


на диагоналях которых 
столбцовому представ- 


В у 
Умхм и Гххм — ортогональные матрицы, 


б строки которых опре- 

деляют собственные векторы, соответствующие собс 
твен - 
мы, ным чис 


Диагонализация вида (5.2.4 
матрицы собственных векторо 
можно записать в виде } 


Ув). [и 


т 
МХМ Ум | =1мхм; 


. У (5.2.5) 
ты [98 =Тухм, 


где Гмхм › Гухм — единичные матрицы порядков Ми № 


) возможна лишь в случаях 
, 


когда 
в являются ортогональным 


и, что 


® В диагональных элементах матриц Л(Е) (с) 
мМхм и Амхм найде 

м по 
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обственные 
[Я КОТОрых 


р наибольших собственных чисел (р << ММ ) и запомним порядок 
их следования. 
( (в) 


т 
р: 
® Из матрицы Я выберем р строк, а из матрицы Имхм — 


1 


р столбцов, соответствующих р наибольшим собственным чис- 
В 
лам, и сформируем матрицы редукции признаков Е), и ЕО) . 
® Для каждого образа из первой части ВБ выполним преобразо- 
вание Карунена—Лоэва, которое может быть представлено в форме 


Е, к) ^ 
у) - (8 (0) - бы»х Е), &=12,..,К; (5.2.6) 
4=1,2,....Ё 


и реализовано на основе матричной схемы, представленной на 
рис. 5.2.1. 

Пространство всех признаков имеет теперь размер Кр”) эле- 
ментов, что меньше первоначального размера в ММ/р? раза. 
В матрице редуцированных признаков наибольшее значение име- 
ют компоненты в верхнем левом углу. 

Отображение редуцированного пространства признаков в сис- 
теме координат ЗО показано на рис. 5.2.2 (для параметров ВБ: 
К=20; г=7; р=9). 

За координаты Х, У и # приняты наиболее значимые первые 
три компоненты для каждого образа, т. е. пиксели с адресами (ел 
(1,2) и (2,1). 

Средний образ в каждом классе представлен вертикальной 
линией (см. правую часть рис. 5.2.2), отдельные образы в клас- 
се — точками (косые линии определяют разброс отдельных обра- 
зов относительно среднего образа). 

Первоначальный размер исходных образов — 112 х 92 пикселя. 
При этом пространство признаков сокращено более чем в 100 раз. 

Как видно из данного примера, метод РСА позволяет реализо- 
вать сокращение пространства признаков, однако не достаточно 
точно решить задачу кластеризации в пространстве признаков. 

















Рис. 5.2.1. Матричная схема редукции признаков для каждого образа 
в классе 


10 Г. А. Кухарев и 



























































зЬ пространство редуцированных признаков 






































Рис. 5.2.2. Отображение пространства редуцированных признаков 


Здесь не максимизированы расстояния между классами (множе- 
ствами признаков) и не минимизированы внутриклассовые рас- 
стояния. Иными словами, некоторые образы отходят от центров 
своих классов и так далеко, что попадают «на территорию» сосед- 
них классов (перекрывают другие классы), а сами центры классов 
имеют неравномерное распределение в пространстве признаков. 

Улучшения кластеризации можно достичь при выполнении 
линейного дискриминантного анализа в редуцированном простран- 
стве признаков, т.е. уже после процедуры КГТ. 


5.3. УМЕНЬШЕНИЕ ПРОСТРАНСТВА ПРИЗНАКОВ 


Исходной информацией для нас тепе 
редуцированных признаков, полученных на предыдущих этапах. 
Цель дальнейшей редукции — улучшение кластеризации про- 
странства признаков. При этом используем метод, основанный 
на линейном дискриминантном анализе. 

Итак: 

® Представим образы из (5.2.6) в форме век 
р? х1, для чего используем операцию канкатенац. 


рь является пространство 


торов размером 
ии столбцов мат- 
риц У , Обозначим полученные векторы как х(® а) 
р 
А. ма =Л О, — 
» Вычислим среднее значение Х всех признаков 
(#) 


для всех Е =1, 


› а также сред- 


нее значение Х"” в каждом классе (для всех № — ВЮ); 
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асов 
КОВ, 
НИЙ 


рае 





® Вычислим матрицы ковариаций Ули и Вузы р ‚ из которых 


первая определяет ковариацию внутри классов, а вторая — меж- 
ду классами: 


5. -Ё 
и, ‚-ХУ(х69 -х®] (х6Я -х®)] (5.3.2) 





К 
У 4. (5.3.3) 


ации 


и 
Н рр = Ух В ззра › (5.3.4) 


для которой определим собственные числа и соответствующие им 
собственные векторы: 


1% 
Ва р? — ви Н ран ра О ах ’ (5.3.5) 


где Бира — диагональная матрица собственных чисел; аа 
ортогональная матрица, строки которой определяют собственные 
векторы, соответствующие собственным числам. 

е В диагональных элементах матрицы р В найдем $ наи- 
больших собственных чисел (8=К-1) и запомним порядок их 
следования. т. 

® Из матрицы Е выберем $ строк, соответствующих $ 


наибольшим собственным числам, и сформируем новую матрицу 


А,„р? редукции признаков. 


К, 
® Пространство признаков х 9) для всех #=1, 2,..., К и всех 
4=1,2,..., Г редуцируем еще раз следующим образом: 


2 „ах, (5.3.6) 


м 5(е, 
где каждый вектор х ч) имеет размер эх 1. 
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пространства редуцированных 


признаков для метода РСА + ГРА 


Рис. 5.3.1. Отображение З)- 
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Рис. 5.3.2. Изменения первых трех признаков редуцированного пространства 
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Отображение редуцированного пространства признаков 5 (4) (для 


параметров ВБ: К =20; [=7; р=9из=19 ) в системе координат 30 
представлено на рис. 5.3.1. За координаты Х ‚ Уи2 приняты первые 
три компоненты для каждого редуцированного вектора. 

Как видно из представленного результата, применение метода 
ГРА позволяет не только дополнительно сократить пространство 
признаков (общее сокращение составляет теперь более 500 раз), 
но и оптимизировать кластеризацию — середины классов лучше 
отдалены друг от друга (см. рис. 5.3.1), а «образы» внутри классов 
сильнее концентрируются у середин классов. Здесь уже практи- 
чески не видно перекрытия кластеров и, следовательно, можно 
решить задачу распознавания простыми способами, используя, 
например, процедуру классификации по принципу минимального 
расстояния до середин классов. 

Другой способ отображения редуцированного пространства 
признаков представлен на рис. 5.3.2: координатные кривые по- 
казывают изменение соответствующих признаков как внутри каж- 
дого класса (номера классов помечены цифрами от 1 до 20), так и 
всей базы данных. Здесь также можно оценить качество класте- 
ризации и отметить классы, для которых есть риск неверного рас- 
познавания (см., например, признаки классов 5 и 13). При з>3 
необходимо, очевидно, исследовать редуцированное пространство 
по всей совокупности признаков. 


5.4. ПРОЦЕСС РАСПОЗНАВАНИЯ 
КОНТРОЛЬНЫХ ОБРАЗОВ 


Хотя известно, что параметр з выбирается из условий 3<5< 
ЗК - 1, выбор конкретных (возможно, наилучших) параметров {©, 
Т, р, 3} для заданного числа классов К возможен лишь при анализе 


синтезированной системы путем проверки иен. р 
Е, а) 
вания (© - Г,) последних образов в ВБ (т.е. образов Омхм с теку- 
щими индексами а =Г+1, 2 +2,..., 9). 
Итак, пусть система распознавания синтезирована для конк- 


ретного значения параметров {К, ©, Г, р, 3}. В результате синтеза 
получены векторы Х ,Ч редуцированного пространства призна- 


В (С) 
ков, а также матрицы редукции А ‚Е№хр» Азхр: { 


(в,а) 


Процесс распознавания нового образа Ом»хм (с текущими индекса- 
ми4 =Г+1, [.+2,..., © ) реализуется в три этапа. 
1. Центрирования текущего образа относительно среднего об- 
раза Ом»х (см. (5.2.1)). 
2. Редукции признаков для центрированного образа с исполь- 
с) га 
зованием матриц а р у. р? И получением вектора Х. 
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3. Вычисление расстояний между вектором Х и векторами 
средних Х ®) всех классов и определение номера класса, которому 
соответствует минимум расстояния. 


Реализацию первых двух этапов запишем в следующей форме: 
редукция 1 


м - РОВ — быхи 8, (5.4.1) 


для всех =1,2,..., Ки всеха=Г+1,[+2,..., @; 
редукция П 


= х 5.4.2 
Хх А, 2Х ь (5.4.2) 
где вектором Х размера р?х1 обозначим результат конкатена- 
ции столбцов матрицы 74). 

Расстояния между векторами определим по одной из извест- 
ных метрик, например, в метрике Евклида, в форме 


а, = = Е =) (5.4.3) 
для всех =Т,2,..., К. 


Графически расстояние от распознаваемого образа до ближай- 
шего класса (расстояние по трем первым координатам — трем 











Рис. 5.4.1. Графическое представление расстоя- 
ния в пространстве признаков 


150 





о ближай: 
м — 1! 


первым компонентам векторов Х“) и Е) в 3)-пространстве ре- 
дуцированных признаков показано на рис. 5.4.1. Здесь цифра- 
ми 2, 5 обозначены высоты средних значений классов (среднее 


значение третьей компоненты векторов х@)). Отдельной верти- 


кальной линией обозначен распознаваемый образ. Линия, соеди- 
няющая верптины нового образа и середины 5-го класса, — оце- 


ниваемое расстояние. Здесь ближайшим соседом является 5-Й 
класс. 


5.5. ВЫБОР ПАРАМЕТРОВ 
СИСТЕМЫ РАСПОЗНАВАНИЯ 


Оценить возможности распознавания представленного выше 
метода можно было бы в аналитической форме, следуя, например, 
[Тза98, 5ме96, 5\е99]. Однако напомним, что представленный ме- 
тод складывается из четырех обоснованных, проверенных и, по 
мнению авторов, наилучших подходов, используемых при реше- 
нии проблем распознавания образов, подходов, высокое качество 
которых было убедительно показано в разд. 3.7. 

В дополнение к этим доказательствам представим результа- 
ты некоторых экспериментов по распознаванию контрольных об- 


разов ВБ (т. е. образов 04, дляа=Г+1, Г+2.,..., 9), полученные 


для различных параметров {К, ©, Г, р, 3}, а также этих же образов, 
но подвергнутых искажениям — масштабированию/расфокуси- 
ровке, наложению шума и др. 


5.5.1. ИЗМЕНЕНИЕ ЧИСЛА КЛАССОВ 
И ЧИСЛА ОБРАЗОВ В КЛАССЕ 


Цель настоящего эксперимента — оценить возможности син- 
теза системы распознавания и качества распознавания при смене 
параметра К. При этом примем параметр К = 4, 20, 40 и 49. 

1. Число классов К =4, число образов Г = 6. 

Исходная база данных — выбранные четыре класса образов из 
базы данных [Ог1**] . Каждый образ имеет размеры 112 х 92 пик- 
селя. 

Оценка эффекта распознавания для такого малого числа клас- 
сов показала, что минимальное число образов в каждом классе не 
должно быть меньше 6, поскольку матрицы ковариации, использу- 
емые в методах РСА и ПЛА, при Г < 6 становятся особенными и в 
таком случае нельзя гарантировать стабильность редукции исход- 
ного признакового пространства. Один из вариантов виртуальной 
базы данных для случая К =4 и Г = 6 представлен на рис. 5.5.1. 

Собственные числа, вычисленные для матриц Амхм и Су, х, упо- 
рядоченные по убыванию, приведены на рис. 5.5.2 (в левой части). 
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Виртуальная база 
Образы для синтеза системы 








Контрольные образы | 





Рис. 5.5.1. База данных для параметров К = 4, О@=10иЁ=6 


Здесь видно, что параметр р не может превосходить значения 10. 
В данном случае редукция 1 (метод РСА) реализована прир=4. При 
этом, поскольку число классов К = 4, то з=3. Пространство редуци- 
рованных признаков показано на рис. 5.5.2 (правая сторона). 
Пространство редуцированных признаков в 3ЗР-форме, получен- 
| ное при редукции Ги П, показано на рис. 5.5.3. Во-первых, виден 


эффект дискриминантного анализа, а во-вторых, пространство при- 
знаков сократилось здесь на величину, близкую к 3500, поскольку 
| 112. 92/3 = 3500. 


Результаты распознавания четырех контрольных образов в каж- 
| дом классе представлены на рис. 





5.5.4, где с левой стороны в 





Собственные числа Пространство признаков 
ВЕ - 























| Рис. 5.5.2. Собственные числа и ИР редуцированных признаков (р=4 
| ве ; 
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Рис. 5.5.3. Пространство редуцированных признаков в З)-форме 





каждом столбце (каждом выделенном классе) показаны конт- 
рольные образы, а с правой стороны — наиболее «близкие обра- 
зы», найденные в ВБ. Обратим внимание на то, что наклон головы 
я 10. и поза (соответствующая углу/точке наблюдения за лицом), а также 
выражение лица (гримаса) подобранных «близких образов» прак- 
тически соответствуют друг другу. Зеркальная симметрия, наблю- 
даемая в некоторых парах, — результат отсутствия в ВБ соответ- 
ствующего образа. 

Отмеченное «соответствие» объясняется тем, что первая и вто- 
виден рая компоненты редуцированных признаков «отвечают» за пово- 
› при: рот и позу головы, а третья — собственно за выражение лица. 




















45 В о 
с 
, |. | Рис. 5.5.4. Подбор близких образов из ВБ в результате распознавания 16 
контрольных образов 
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Рис. 5.5.5. Итоговые результаты распознавания контрольных образов 
для системы с параметрами К = 4, @ = 10, р=4, 3=3 


При этом влияние компоненты в процессе распознавания (в ре- 
зультате выбора близкого образа) тем выше, чем ниже порядко- 


вый номер компоненты. 


В итоге распознавание 16 контрольных образов (рис. 5.5.5, ле- 
вый график) составило 100%. 

С правой стороны на рис. 5.5.5 графически показан итог рас- 
познавания 20 контрольных образов для [=5Би ВБ, показанной 
на рис. 5.5.1. Как видно, здесь уже имеется одно неверное распо- 
знавание в классе номер 1 (при общем итоге 95 %). При этом 
следует подчеркнуть, что образы класса 1 имеют значительные 
(по сравнению с другими классами) изменения ка 
головы, так и размеров. 

Аналогичные эксперименты распознавания были выполнены и 
для других четырех выбранных классов базы [От1**]. При этом вез- 
де при Г = 6 распознавание составило 100 %, что может свидетель- 
ствовать о возможности применения описанного метода распозна- 
вания для граничных (снизу) параметров К и Г. Обычно при таких 
параметрах системы распознавания синтезируются при решении 
задач контроля доступа ограниченного числа пользователей. 

2. Число классов К =20, 40, 49. 

Увеличение числа классов К требует и 
зов Г в ВБ, и увеличения параметра р в границах возможного. 
Наилучший выбор последнего параметра возможен только в ходе 
анализа качества распознавания синтезированной системы при 
вариациях р во всем возможном диапазоне. 

Представим результаты работы системы с па. 
Т=1; р=Эи з= 19. Образы исходной базы да 


к в повороте 


увеличения числа обра- 


раметрами К = 20; 
нных и результат 
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Рис. 5.5.6. Итоговые результаты распознавания 60 контрольных образов 
для системы с параметрами К = 20; Г=7; р=9из=19 


построения виртуальной базы для одного из классов базы [Ог1**] 
были приведены в предыдущем разделе, а пространство редуци- 
рованных признаков (в 20- и 3)-форме) для этого случая показа- 
но также в предыдущем разделе на рис. 5.3.1 и 5.3.2. 

Результаты распознавания 60 образов (по 3 образа в каждом 
классе) для системы с параметрами К=20; Г=7; р=9 и з=19 
представлены на рис. 5.5.6. Очевидно, что распознавание конт- 
рольных образов достигло 100%. 

Для системы распознавания с параметрами К = 40; Г=7; р=Т, 
8, 9, 10 из = 39 итоговые результаты распознавания контрольных 
образов представлены на рис. 5.5.7. Здесь также распознаются 
все 100 % контрольных образов. 

Все результаты, представленные выше, основаны на базе дан- 
ных [Ог|**]. Не исключено, что высокие показатели распознава- 
ния (поиска образа в базе, который соответствует контрольному 
образу) связаны с качеством самой базы [Ог1**]. 

Отметим особенности данных этой базы: 

® высокое разрешение каждого изображения при относитель- 
но малых его размерах; 

® относительно одинаковый размер собственно лиц; 

® размещение образа лица практически на поле всего изобра- 
жения; 

® практически неизменный темный фон (текстура) и одинако- 
вое освещение; 

® незначительные изменения в поворотах головы в плоскости 
ХУ изображения, оси Й и оси Х (пункта осмотра головы). 

Интересно проверить представленный выше метод (качество рас- 
познавания/поиска в базе) в случае, когда исходная база данных 
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Рис. 5.5.7. Итоговые результаты распознавания 120 контрольных образов 
для системы с параметрами К = 40; Г. =7;р=Т, 8, 9, 10 из = 39 
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Рис. 5.5.8. Классы 41 — 46 новой базы данных 
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Рис. 5.5.9. Пространство редуцированных признаков для системы с параметрами 
К =49; [=71; р=10 из=48 
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Рис. 5.5.10. Итоговые результаты распознавания 147 контрольных образов 
для системы распознавания с параметрами К = 49, @ = 10, [/=7, р=10, 5 =48 
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сложена из двух или более разнородных баз. В связи с отмечен- 
ным к базе данных [Ог!**] присоединим еще девять классов обра- 
зов, полученных непосредственно с камеры @и1сЁСат [Клс98,99]. 
Первые шесть классов образов этой базы приведены на рис. 5.5.8. 
По сравнению с данными базы [От1**], новые данные (изображения) 
имеют более низкое разрешение, белый фон, разное освещение и раз- 
меры собственно лиц, а также значительные изменения в поворо- 
тах головы. 

Следствие такого отличия исходных данных отчетливо прояв- 
ляется при представлении редуцированного пространства призна- 
ков (рис. 5.5.9 пространство, обведенное эллипсом) — новые при- 
знаки сгруппированы отдельно от признаков базы [Ог!**]. Про- 
странство признаков получено для системы с параметрами К = 49; 
Г=Т; р=10из=48. 

Результаты распознавания показаны на рис. 5.5.10. Видно, что 
и здесь также распознаются все 100 % контрольных образов. 


5.5.2. РАСПОЗНАВАНИЕ ПРИ НАЛОЖЕНИИ ШУМА 


Правильное распознавание образов при наложенном, но пред- 
варительно не отфильтрованном шуме может свидетельствовать 
о робастности системы распознавания к изменениям первичных 
признаков. Представим результаты работы системы распознава- 
ния (поиска образов в базе) с параметрами К =20; Г=7; Р=9и 
5 = 19 под влиянием нормального белого шума, наложенного на 
контрольные образы. 

Для примера на рис. 5.5.11 представлены образы первого и двад- 
цатого класса ВБ, полученной из базы [Ог1**]. Первые семь образов 
каждого класса использованы для синтеза системы распознавания. 
Последние три образа в классе — контрольные — находятся под 
шумом (для среднеквадратического значения с = 100). 

Результат распознавания контрольных образов для этих же 
классов представлен на рис. 5.5.12. 

Для различных значений с результаты распознавания 3 конт- 
рольных образов в каждом из 20 классов (для системы с парамет- 
рами К = 20, @ =10, Г =7, р=Т, 3=19 ) сведены в табл. 5.5.1 (вто- 
рая строка). Из нее видно, что для ос = 130 результат распознава- 
ния составляет 98 % (не распознан один образ). Итоговые 
результаты распознавания 3 контрольных образов в каждом из 
40 классов (для системы с параметрами К = 40, @ = 10, .=7,р=12 
3 = 39 ) представлены в табл. 5.5.2 (вторая строка). Здесь в. ты 
значенийос > 70 результат распознавания составляет менее 100 %. 

Применяя мажоритарный принцин — оценку результата рас- 
познавания по двум правильно узнанным образам из трех в каж- 
дом отдельном классе, можно отметить (см. третьи строки 
табл. 5.5.1 и 5.5.2), что в обоих случаях распознавание прошло 
успешно со 100 %-ным результатом для значений с>110. 
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Рис. 5.5.11. Исходные и контрольные образы 


Для системы с параметрами К = 20, © = 10, Г=Т,р=Т, 3 = 19 по- 
ложим о = 150 с тем, чтобы в итоговом результате распознавания 
наверняка появились неверно классифицированные образы. Гра- 
т, фическое представление итогового результата распознавания для 
этого случая приведено на рис. 5.5.13 (левая сторона). Оценка 
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й Рис. 5.5.12. Некоторые результаты распознавания зашумленных контрольных 
ы образов системой с параметрами К=20; Г=7; р=9 из=19 
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Таблица 5.5, 1 
льных образов для системы 

Итоговые результаты распознавания 60 контро. 
с параметрами К =20, © = 10, Г=7, р=Т, в=19 


И ЕО 
60 образов, % распознавания 100 | 100 | 100 | 100 | 100 | 100 | 100 7 я 
100 | 100 | 100 | 100 | 100 | 100 | 100 | 100 | 100 

Таблица 5.5.2 


Итоговые результаты распознавания 120 контрольных образов 
для системы с параметрами К =40, © = 10, Г. =7, р= 12, з=39 


120 образов, 99,1| 98,3| 96,6| 96,6| 95,0| 95,8 

% распознавания 

Два из трех, 

% распознавания 

результата распознавания по двум правильно Узнанным образам 

из трех приведена на рис. 5.5.13 (правая сторона). 
Аналогичные вышеприведенным о 


других значений числа классов Ки 
распознавания. 







Два из трех, % распознавания 









ценки были получены и для 
других параметров систем 
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Рис. 5.5.13. Два способа оценки результата распознавания 

















Таким образом, граница дляс, 
ное распознавание зашумленных 
ся в пределах до 100. 

При этом следует отметить, что, во-первых, в практике распо- 
знавания не используют таких высоких значений ос наложенного 
шума, а во-вторых, в данном случае не была выполнена предвари- 
тельная фильтрация распознаваемых образов. 


при которой возможн 


о правиль- 
контрольных образов 


› находит- 
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5.5.3. РАСПОЗНАВАНИЕ 
ПРИ МАСШТАБИРОВАНИИ ОБРАЗОВ 


На практике при распознавании челове 
познаваемый образ (исходный образ лица 
чем требуется. Это происходит, например, 
некоторой сцены на отдаленном расстоянии и выделении конк- 
ретного образа лица из сцены, выделении образа лица из разно- 
родных фотодокументов ит. д. [3с699]. 

В исследуемом нами методе исходными признаками являют- 
ся яркости всех ММ пикселей распознаваемого образа, а редукция 
пространства признаков реализуется в соответствии с матрица- 


ка по лицу часто рас- 
) меньше по размеру, 
при фотографировании 


ми р и О, ориентированными на заданный размер изобра- 
жения, содержащего М строк и М столбцов. Очевидно, что в дан- 
ном случае необходимо перемасштабирование исходного (умень- 
шенного) изображения до заданного размера. Для приведения 
исходного изображения к заданному размеру используется дву- 
мерная интерполяция, например, бикубическая, билинейная или 
так называемая «ступенчатая». Последний вид интерполяции сво- 
дится, по существу, к соответствующему повторению каждого пик- 
селя исходного изображения М/т раз по строкам и М/п по 
столбцам, где т и п — число строк и столбцов исходного 
изображения. 

Каждый вид интерполяции вносит определенные искажения 
в результирующий образ. В лучшем случае можно получить как 
бы «расфокусированное» изображение, в худшем — «грубо кван- 
тованное» (рис. 5.5.14). На этом рисунке представлен контрольный 
образ ВБ, размер которого — 112 х 92 пикселя. Размер этого обра- 
за был уменьшен в 6 раз, а затем восстановлен различными вида- 
ми интерполяции, для чего были использованы процедуры ппгез1яе 
пакета МАТГАВ. 





Контрольный Интерполяция 
образ Бикубическая Билинейная Ступенчатая 





м 























Рис. 5.5.14. Искажения, возникающие при перемасштабировании образов 
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Рис. 5.5.15. Некоторые результаты распознавания контрольных образов при 
изменении их масштаба и возникающем при этом эффекте их расфокусировки 


Используем такое двойное перемасштабирование для имита- 
ции реальной ситуации, возникающей в задачах распознавания, и 
оценим качество распознавания получаемых при этом образов. 

Распознавание расфокусированных образов. Изменим раз- 
меры контрольных образов ВБ соответственно в 2, 3, 4, 5, би 7 раз, 
а затем восстановим их первоначальные размеры. При использо- 
вании бикубической и билинейной интерполяции достигнем эф- 
фекта «расфокусировки». 

Результат одного из вариантов 
чая показан на рис. 5.5.15, гдевв 
циенты изменения масштаба, 


распознавания для такого слу- 
ерхней строке указаны коэффи- 
во второй строке — образы, предъяв- 


контрольных образов. 
Итоговые результаты распознава: 
каждом из 40 классов (для системы 
Г=Т,р=12,8=39) приведены во вт. 
в строке 3 указана оценка качест 
тарному принципу. 
Распознавание грубо квантованных о 
го квантования контрольного образа мож 


ния 3 контрольных образов в 
с параметрами К = 40, © = 10, 
орой строке табл. 5.5.3 и 5.5.4, 
ва распознавания по мажори- 


бразов. Эффекта грубо- 
но достичь при исполь- 


Таблица 5.5.3 
азов для системы 
кой интерполяции 


Итоговые результаты распознавания 120 к 


онтрольных обр 
< параметрами К = 40, © = 10, Г=7, р= 12, з 


=39 и бикубичес: 





Масштаб 1 1/2 





Распознавание 120 100 100 
образов, % 


Распознавание 100 100 
по двум из трех, % 
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Таблица 5.5.4 
Итоговые результаты распознавания 120 контрольных образов для системы 
с параметрами К =40, 9 =10, Г=7, р=12, з=39 и билинейной интерполяции 


Масштаб 1 1/2 1/3 1/4 1/5 1/6 1/7 
Распознавание 120 
образов, % 100 100 100 100 97,5 | 92,5 | 91,6 
Распознавание 
по двум из трех, % 100 100 100 100 97,5 95,0 92,5 


зовании ступенчатой интерполяции. Здесь также изменим разме- 
ры контрольных образов ВБ соответственно в 2, 3, 4, 5, би Т раз, 
а затем восстановим их до первоначальных. 

Результат одного из вариантов распознавания для такого слу- 
чая приведен на рис. 5.5.16, где в верхней строке указан коэффи- 
циент изменения масштаба, во второй строке — образы, предъяв- 
ленные для распознавания, а в третьей — наиболее близкие обра- 
зы, выбранные из ВБ в процессе распознавания расфокусированных 
контрольных образов. 

















И 1/2 1/3 1/4 1/5 
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Рис. 5.5.16. Некоторые результаты распознавания контрольных образов при из- 
менении их масштаба и возникающем при этом эффекте их грубого квантования 





Таблица 5.5.5 
Итоговые результаты распознавания 120 контрольных образов для системы 
с параметрами К =40, © =10, Г=7, р= 12, з= 39 и ступенчатой интерполяции 





Масштаб 1 





Распознавание 120 100 
образов, % 


Распознавание 100 
[по двум из трех, % 
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Итоговые результаты распознавания 3 контрольных образов 
в каждом из 40 классов (для системы с параметрами К = 40, © = 10, 
Г=Т,р=12, 3 = 39) представлены во второй строке табл. 5.5.5, в стро- 
ке 3 — оценка качества распознавания по мажоритарному прин- 
ципу. 

Как показывают полученные результаты, вид интерполяции, 
используемый при восстановлении заданного размера контрольного 
образа, незначительно влияет на качество распознавания. Из этих 
же результатов следует, что 100 % -ное распознавание контрольных 
образов возможно при изменении их масштабов не более чемв3 - 


4 раза. При этом размеры распознаваемых образов не должны 
быть ниже 28х23 пикселя. 


5.5.4. РАСПОЗНАВАНИЕ ПРИ МАСШТАБИРОВАНИИ 
И НАЛОЖЕНИИ ШУМА 


Предназначенный для распознавания исходный образ может 
быть получен из различных источников и в том числе: 

® при наблюдении некоторой сцены с отдаленного расстояния 
и выделении конкретного образа лица из этой сцены; 

® при выделении изображений лица из разнородных фотодо- 
кументов; 


® при выборе образов из компьютерных баз данных, структу- 
рированных различными способами; 

® непосредственно с цифровой или аналоговой видеокамеры. 

При выборе исходного образа из различных источников, его транс- 
миссии и предварительной обработки (включающей, например, де- 
компрессию, когда данные в некоторой базе находятся в сжатом 
виде, процесс оптического или электронного сканирования, дискре- 
тизацию и т. д.) размер распознаваемого образа может оказаться 
меньше, чем требуется и, кроме того, находиться под шумом. 

Предвидеть все варианты масштабных и шумовых изменений, 
возникающих в распознаваемых образах, практически невозмож- 
но. Однако положим, что механизмы таких изменений описыва- 
ются схемами, представленными в табл. 5.5.6, где знаки «+» обо- 
значают наложение шума, а стрелки «1» или «|» — перемасшта- 
бирование размера исходного образа в сторону увеличения или 
уменьшения соответственно. 

Если говорить о степени искажений, то при одних и тех же 
значениях о и масштабном коэффициенте © при второй схеме из 
табл. 5.5.6 создаются условия для появления меньших искаже- 
ний, чем при третьей, но больших, чем при первой. Сказанное 
касается также вариантов 5, 4 и 6. Отметим, что на практике рас- 
познавания образов вторая и пятая схемы искажений встречаются 
наиболее часто. 

С учетом сказанного представим результаты работы системы 
распознавания для случая, когда на исходный образ сначала нало- 
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Таблица 5.5.6 


Механизмы изменения контрольных образов 




















р 
№ азмер исходного образа Шум Перемасштабирование 
варианта 

1 Меньше требуемого 

2 Меньше требуемого 

3 Меньше требуемого 

4 Больше требуемого 

5 Больше требуемого 

6 Е Больше требуемого 














жен нормальный белый шум, а затем размер этого образа перемас- 
штабируется до требуемого. Таким образом, рассмотрим вторую 
схему (из табл. 5.5.6) искажений распознаваемых образов, а в ка- 
честве исходных используем контрольные образы, размеры кото- 
рых уменьшены в 2, Зи 4 раза. При этом масштабный коэффици- 
ент 0 увеличения размера исходных образов составит 2, Зи 4. 

Качественную границу между верно и неверно распознанными 
образами можно увидеть, сравнивая изображения на рис. 5.5.17 
и 5.5.18 — 5.5.20. 

На рис. 5.5.17 в правом нижнем углу выделены три конт- 
рольных образа, а на рис. 5.5.18 — 5.5.20 те же образы, но искажен- 
ные в соответствии со схемой 2 табл. 5.5.6. Образы на рис. 5.5.18 — 
5.5.20 отличаются только видом интерполяции, используемой при 
перемасштабировании. На каждом из рис. 5.5.18 — 5.5.20 с левой 
стороны представлены образы (для значений &=4ис=20), верно 
распознанные системой с параметрами К = 20; [=7; р=9из= 19, 
ас правой (для значений © =4 и с=40) — неверно распознанные. 





Рис. 5.5.17. Контрольные образы 20-го класса ВБ 
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Рис. 5.5.18. Искажения контрольных образов (бикубическая интерполяция) 


© =4; 0*=50 








 =4, 9 =20 











Рис. 5.5.19. Искажения контрольных образов (билинейная интерполяция) 





@ =4, д =20 3 @ =4, д =50 











: ю было определение границ 
для значений с и масштабного коэффициента @, при которых вы- 


полняется верное разпознавание искаженных образов 
Итоговые результаты распознавания 3 конт 







В четвертой строке табл. 5.5.7 приведены итоговые результа- 
ты распознавания по мажоритарному принцип 


У. Как види а 
лом верное распознавание возможно при значениях =. Е ге 
б= 20: кс 


перемасштабирования образов приведены в табл. 5.5.8 (третья и 
четвертая строки). 
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Таблица 5.5.7 
Итоговые результаты распознавания 60 контрольных образов для системы 
с параметрами К =20, © =10, Г=7, р=7, з=19 и бикубической интерполяции 















Масштаб | 1/2 ] 1/3 1/4 

= 20 [30 | 40 | 50 |20 [30 | 40 [50 [20] 30 | 40 | 50 | 
Распознавание 
60 образов, % 100 | 100 | 100 ы 100 | 100| 98 | 90 | 100 |966 91,6 





Распознавание 
100 | 95,0 | 80 





из трех, % 





по двум образам |100 | 100 | 100 по 100 | 100 | 100 | 90 








Таблица 6.5.8 
Итоговые результаты распознавания 60 контрольных образов для системы 
с параметрами К =20, © = 10, Г. =7, р=Т, 3 = 19 и билинейной интерполяции 










Масштаб 1/2 
Е 20 | 30 | 40 | 50 


Распознавание |100 |100|100 |100 | 100 | 100| 96,6| 93,3|100| 96,6| 91,6| 81,6 
60 образов, % 

Распознавание 

по двум образам |100 | 100 | 100 | 100 | 100 | 100 |100 1001100 |100 [90 
из трех, % 


Таблица 5.5.9 
Итоговые результаты распознавания 60 контрольных образов для системы 
с параметрами К = 20, О = 10, Г, =7, р=Т, 3 = 19 и ступенчатой интерполяции 































1/2 1/3 1/4 
20 | 30 чо | 50 20 | 30 40 | 50 | 20 | 30 40 


Масштаб 








с 





Распознавание |100 |100 |100 | 100 | 100 | 100 | 100 | 95 |100| 96,6 | 93,3 | 91,6 
60 образов, % 


Распознавание 
по двум образам |100 | 100 | 100 | 100 | 100 | 100 | 100 | 100 | 100 | 100 95,0 |100 





из трех, % 








Как видим, и здесь в целом верное распознавание возможно 
при значениях о=Зи с=30, а также при значениях 9=4 и 
с = 20. 

Итоговые результаты распознавания 3 контрольных образов в 
каждом из 20 классов для системы с параметрами К = 20, © = 10, 
Г=Т, р=Т, 3 = 19 и ступенчатом способе интерполяции в процессе 
перемасштабирования образов приведены в табл. 5.5.9 (третья и 
четвертая строки). 

Последний эксперимент показывает, что верное распознавание 
искаженных масштабированием и шумом образов возможно при 
значениях 9 =Зи с=40, а также при значениях &=4и с=20. 
Однако граница для параметра с скорее всего не должна превы- 
шать величины 20. 
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Рис. 5.5.21. Исходные и контрольные образы 40-го класса ВБ 


О подобных границах параметров © и с могут свидетельство- 
вать и результаты распознавания контрольных образов в базе 
данных, содержащей 40 классов образов. На рис. 5.5.21 представ- 
лены все 10 образов 40-го класса, а контрольные образы выделены 
в нижнем правом углу. 

Изображения, предназначенные для распознавания и иска- 
женные в соответствии со схемой 2 табл. 5.5.6, представлены 
на рис. 5.5.22. 

Итоговые результаты распознавания 3 контрольных образов в 
каждом из 40 классов для системы с параметрами К = 40, © = 10, 
Г=Т7,р=12, 8 = 39 и ступенчатом способе интерполяции в процес- 
се перемасштабирования образов представлены в табл. 5.5.10 (тре- 
тья и четвертая строки). Из этих результатов видно, что в целом 
верное распознавание контрольных образов возможно при = 2, 3, 
4ис=20. 

Все выполненные эксперименты по распознаванию контроль- 
ных образов при их масштабировании и наложении на них шума 
показывают, что устойчивость процесса распознавания высокая. 





@ =4, ©. =20 | @ =4, < =50 











Рис. 5.5.22. Искажения контрольных образов (ступенчатая интерполяция) 
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Таблица 5.5.10 


Итоговые результаты распознавания 120 контрольных образов для системы 
с параметрами К = 40, © = 10, Г =7, р= 12, 3=19 и ступенчатой интерполяцией 





1/2 
| А 20 | 30 | 40 | 50 | 20] 30 [40 | 50| 20| 30 | 40 | 





Масштаб 





1/3 1/4 








Распознавание 


120 образов, % 100 |100 98| 97| 100 | 96,6 | 94,1 | 85,8 














Распознавание 


по двум образам |100 | 100 | 100 | 100 | 100 |100 |97,5|90 
из трех, % 





100 | 93,3 | 86,6 | 74,1 
100 | 97,5 | 92,0 | 82 











Достижение 100 %-ного уровня распознавания контрольных 
образов возможно при значительных изменениях параметров &@ и 
б и достаточных для решения практических задач. Таким обра- 
зом, можно подтвердить качество метода распознавания, рассмот- 
ренного в настоящей главе и реализованного на основе работ [Тза98, 
бме96,99]. 


5.5.5. РАСПОЗНАВАНИЕ ОБРАЗОВ, 
НЕ ПРИНАДЛЕЖАЩИХ СОБСТВЕННОЙ БАЗЕ 


А теперь зададимся таким вопросом: что произойдет, если для 
распознавания будут предъявлены образы, не входящие в исход- 
ную базу данных? 

Ясно, что на каждый предъявленный к распознаванию образ 
система подберет наиболее близкий ему из образов, имеющихся в 
базе. Однако возникают при этом и другие вопросы: какие при 
этом получатся результаты и можно ли по ним определить, что 
предъявленный образ не принадлежит данной базе? Что будет 
определять близость образов и что будет критерием их разли- 
чия? 

Для получения ответов на поставленные вопросы выполним 
следующий эксперимент. Предъявим системе с параметрами 
К=20, 9=10, Г=Т,р=Т,3= 19 60 собственных контрольных обра- 
зов и 87 новых, из которых 60 принадлежат классам 21—40 базы 
данных [Ог1**], а 27 — базе, использованной в [Кис99] и частично 
представленной на рис. 5.5.8. В дальнейшем все эти новые обра- 
зы также будем называть контрольными. 

За качество распознавания примем меру подобия контрольно- 
го образа тому классу ВБ, который будет выбран системой, и эту 
меру оценим с помощью метрик Го и Т2. Иными словами, будем 
вычислять расстояния между признаками контрольного образа и 
средними признаками выбранного системой класса (все оценки 
выполним в редуцированном пространстве признаков). Для мет- 
рики Го примем значение порога 6 = 30, что составляет не более 
30% максимальных значений признаков. Далее, поскольку из 
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Рис. 5.5.23. Результаты оценки расстояний для «своих» и «чужих» образов 


каждого класса системе будут предьявлены по три контрольных 
образа, результаты оценки расстояний усредняются по трем ин- 
дивидуальным оценкам. 

В результате выполненного эксперимента (или «распознавания» ?) 
получены по 49 оценок расстояний для каждой из метрик. Эти 
оценки представлены на рис. 5.5.23. Верхний график на рисунке 
характеризует оценки расстояний по метрике То, анижний — по мет- 
рике Г... Буквами а, Бис обозначены соответственно зоны: 

а) — оценки расстояний для контрольных образов, принадле- 
жащих ВБ; 


Ь) — оценки расстояний для контрольных образов базы 
[Ог!**] — классы с 21-го по 40-й; 

с) — оценки расстояний для контрольных образов, принадле- 
жащих базе [Кис99] — классы с 41-го по 49-й. 

Представленные результаты убедительно по 
щее: 

® наименьшие расстояния получены для контрольных образов, 
принадлежащих собственной ВБ (зона а графиков); 

® оцениваемые расстояния хорошо разделяют контрольные об- 
разы на «свои» и «чужие», т. е. образы, принадлежащие собствен- 
ной ВБ и не принадлежащие ей; ыы 

® оцениваемые расстояния (по крайней мере, в метрике 1.2) также 
хорошо разделяют зоны Ь и с графиков, т.е. контрольные образы, 
плученные из разнородных источников. 

Метрика Го не выявила различий в контрольных образах, полу- 
ченных из разнородных источников, по двум причинам: посколь- 
ку, во-первых, она не приспособлена для оценки расстояний в про- 
странстве редуцированных признаков, что отмечено в [51100], а во- 


казывают следую- 
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Рис. 5.5.24. Результаты подбора к контрольному образу образа из ВБ 


вторых, эксперимент проводился для системы с параметрами К = 
=20, © =10, Г=7,р=Т, $ = 19 и для оценки расстояний использова- 
лось всего 19 компонент. Хотя и для этой метрики разделение 
контрольных образов на «свои» и «чужие» тоже заметно (в зоне 
а расстояния существенно меньше, чем в зонах (Ъ + с). 

В целом же для целей верификации распознанного образа — 
«свой» или «чужой» — можно, очевидно, использовать обе метри- 
ки, хотя в данном случае предпочтение следует отдать метрике Г... 

Оценим теперь результаты выполненного эксперимента с каче- 
ственной стороны, для чего сравним визуально между собой конт- 
рольный образ, не принадлежащий ВБ, и образ, выбранный систе- 
мой. На рис. 5.5.24 приведены три пары образов, из которых каж- 
дый левый образ в парах контрольный, а правый — образ, выбранный 
системой. В верхней строке над каждым образом указаны номера 
классов, которым они принадлежат (в нумерации базы [Ог!**]). 

Визуальный анализ приведенных пар образов подтверждает — 
система распознавания действительно выбирает из ВБ образ, наи- 
более близкий контрольному: в каждой паре образов можно най- 
ти определенную меру сходства. 

В целом же при отсутствии в ВБ «очень похожего» образа сис- 
тема подберет образ, в котором сходство с контрольным образом 
будет определяться: одинаковым поворотом и/или наклоном го- 
ловы, общими элементами на лице (брови, глаза, очки, борода, вид 
прически, цвет волос ит. д.), выражением лица, фоном, на котором 
размещено лицо (черный, серый, белый), размещением собственно 
лица в поле всего изображения (циклический сдвиг) и т. д. 














6. СИСТЕМЫ РАСПОЗНАВАНИЯ «ОМ-ТЛМЕ» 


6.1. СТРУКТУРА СИСТЕМЫ РАСПОЗНАВАНИЯ 


Ниже будут представлены системы, работающие в отличие от 
рассмотренных в гл. 5 с цифровой камерой в режиме ‹оп-Шпе». 
При этом решается ряд дополнительных проблем, которые связа- 


ны с необходимостью предварительной обработки изображений 
с камеры и включают: 


® локализацию требуемого лица из окружающего его фона или 
отделение его от других лиц; 


® выделение наиболее информативной части лица из его обще- 
го вида в соответствии с выбранной частью на эталоне (например, 
2/3 нижней части лица, включая брови, глаза, нос, рот); 
® согласование размеров лиц (для достижения одинакового 
масштаба с эталоном); 
® согласование пункта наблюдения распознаваемого лица с вы- 
бранным для эталона (элиминация больших углов поворота го- 
ловы в момент получения образа лица) и т. д. 
® элиминацию влияния мимики, прически или других элемен- 
тов (сережки и кольца, очки ит. д.) распознаваемого образа; 
® элиминацию способа освещения данного образа или согласо- 
вание с освещением для выбранного эталона. 
Отмеченные проблемы становятся особенно 
случаях, когда распознавание выполняется п 
эталонов в каждом классе образов, 
практике. И хотя большая часть известных систем распознава- 
ния «оп-Ппе» основана на использовании баз данных, в которых 
имеются различные варианты образов лица в каждом классе, — 
невозможно предусмотреть все случаи, встречающиеся в жизни 
(т.е. все варианты масштабов исходных изображений, поворотов 
головы — пунктов наблюдения, освещения, фона ит. д.). Практи- 
чески кадый раз мы имеем дело с распознаванием нового образа, 
который как бы не совсем точно соответствует собственной базе 
данных (см. конец гл. 5). 
Процесс распознавания в системе «оп-Ппе» можно представить 
следующим образом. Пусть несколько разных изображений лиц 
(образов) заданного класса (или классов) находятся в базе дан- 
ных. Каждый такой образ можно представить как эталон. В про- 
цессе реализации задачи распознавания новый образ получаем 
непосредственно с камеры. Необходимо проверить его принадлеж- 
ность базе данных: либо посредством вычисления некоторой меры 
подобия между новым образом и каждым эталоном, либо по- 
средством вычисления меры подобия между некоторой характе- 
ристикой нового образа и совместной характеристикой В классе 
образов. Новый образ будет принадлежать тому классу, мера по- 
добия с которым будет наивысшей и если эта мера пр 
некоторый порог идентификации. 


актуальными в тех 
о небольшому числу 
что обычно и имеет место на 


евыпает 
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Образ с камеры Выделение лица Образ для Наиближайший 
распознавания класс 





















РЕЗУЛЬТАТ 











ех Исходная база данных 











На Рис. 6.1.1. Процесс распознавания нового образа в системе «У1з ог Т4епийса оп» 


Трудности реализации подобных процессов распознавания по- 
кажем на примере системы » \У1з ог Чепй сай оп», реализующей 
идеи работы [Зп100]. 

Ни Системы класса «\1зЦог еп Ясайоп» решают задачу иден- 
08 тификации людей по изображению лица (например, идентифика- 
и ция гостя, входящего в дом или бюро, верификация посетителя 
а, страницы в Интернете, распознавание постоянного покупателя в 
36 магазине и т. д.). Главная особенность таких систем (при реше- 
нии самой задачи распознавания человека по лицу) — простота 
тр реализации задач и работа в режиме ‹оп-Цпе». й 
д Основные операции обработки образов в системе «\15Иог 
н ЧепиНсаоп» представлены на рис. 6.1.1. Исходная база дан- 
0" ных содержит 10 классов образов — по одному образу в каждом 
м классе. Все образы базы представлены в нижней части рисунка. 
Размер изображения, полученного с камеры, 240х 320 пикселей. 
Интересующий нас образ лица автоматически ищется в поле выде- 
ленной рамки (левый верхний кадр) с помощью вспомогательно- 
го эталона, содержащего произвольное лицо на белом фоне. В сле- 
е дующем кадре видно завершение поиска интересующего нас об- 
ы раза. По окончании процесса выделения лица из исходного изобра- 
О жения получаем образ для распознавания размером 112 х 96 
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(результат такого масштабирования п 
в блоке за стрелкой «Модификация»). 


При этом элиминируются такие нежелат 
масштаб (в пределах +10 %), циклический с 


в поле рамки целого образа (в пределах 
ки), повороты головы (в пределах 15 % 
образ (размера 16х16 пикселей) сравн 
масштабированным образом базы. 
При этом используется метрика: 


То =У1 при условии 5 


по которому каждый пиксель ху 
соответствующим пикселем у,, 
разности превышает некоторы 
меры превышения порога («м 
единицу. 


одног 


В результате сравнений с образами всей ба, 


рый ряд, элементами которого будут пар 


порога. Решение о принадлежности распозн. 


деленному классу принимается по миним 
Функция превышения порога для об 
непосредственно из базы данных, приве 
оси Х отмечены номера классов, а по ос 
превышения порога. Видно, что мини 
класс. Результат сравнения образа, 
6-й класс), со всеми 10 образами ба 
превышения порога на рис. 6.1.2Ъ. 
мум приходится на шестой класс, 
не такая «идеальная», как выше. 
Если результат, полученный п 
общее число пикселей сравниваем 
чае на 16х16 =256) и отнять его 
подобия, выраженную в диапазоне от 0 д 
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ри сравнении, 

ых изображени: 
от еди 

о1. Я. 


Рис. 6.1.2. Функции превыше. 

ния порога: а — функция пре- 

вышения порога для образа, взя. 

того из базы данных; Ь — фун. 

кция превышения порога для 

нового образа, полученного с ка. 
меры 


пикселей (третий кадр 
сверху). 

Идея подхода [$1100] 
состоит в том, что образы 
исходной базы данных и 
распознаваемый образ 
масштабируются к раз- 
меру 16х16 пикселей 
редставлен на рис. 6.1.1 


ельные факторы, как 
двиг собственно лица 


1-2% от размера рам- 
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эта мера к единице, тем 
выше вероятность пра- 
вильного распознавания. 
На рис. 6.1.3 приведена 
нормированная мера для 
рассмотренного выше 
примера. Из него также 
видно, что максимум 
приходится на шестой Рис. 6.1.3. Нормированная мера показателя но- 
класс. добияР=1 - (У1)/256 для нового образа шестого 
А ‘теперь обратим класса, полученного с камеры 


внимание на качество распознавания: нормированная мера пока- 
зателя подобия во втором случае была чуть ниже 1, что можно 
классифицировать как «неплохое распознавание». Однако здесь 
видны два «претендента» на признание принадлежности рас- 
познаваемого образа — к классу 2 (с мерой подобия выше 0,5) и 
к классу 9 (с мерой подобия несколько ниже 0,5). Если внима- 
тельно посмотреть на образы исходной базы (см. рис. 6.1.1), то 
можно найти много общего между образами 6-го и 2-го, а также 
6-го и 9-го классов. 

Предъявим системе новые образы, причем такие, которые или 
не входят в базу данных или не относятся к фотографиям лица 
человека. Эти новые образы и выбранные системой претенденты 
приведены на рис. 6.1.4 и 6.1.5. 

Анализируя идею работы [31100] и представленные результа- 
ты, можно отметить: 

® система реализует очень простой алгоритм распознавания и, 
следовательно, не требует сложных вычислений и больших объе- 
мов памяти; 

® система идетифицирует образы, относящиеся к базе данных, 
при их получении практически в тех же условиях, что и образы 
исходной базы данных, и, кроме того, распознаваемый образ дол- 
жен быть «актуальным» по отношению к образу в базе данных; 

® реализованная система имеет 100 %-ный уровень ложной 

































































Рис. 6.1.4 Образы, не входящие в базу данных, и результат их распознавания 
. 6.1.4. , 
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Рис. 6.1.5. Результат распознавания некорректно выбранного образа 





идентификации для образов, не относящихся к базе данных, хотя 
в выбранных системой классах-претендентах можно найти и много 
общего с предъявленными для распознавания образами: система 
реагирует на внешнюю форму распознаваемого образа, на овал 
лица, форму прически и яркость освещения, заданного для рас- 
познавания образа. 

Для улучшения качества распознавания в [51100] предложено 
проводить распознавание на 3 — 5 образах одного и того же «посе- 
тителя» (или хранить в базе данных 3—5 вариантов образов для 
каждого класса), что, однако, гарантирует распознавание в режиме 
«оп-Нпе» не выше 55 %. Таким образом, и в данном случае при- 
дется минимизировать или полностью исключить влияние всех 
мешающих факторов, в том числе постоянно обновлять исходную 
базу данных «актуальными» образами посетителя. Проблема лож- 
ной идентификации образов, не принадлежащих классам исход- 
ной базы, возникает не только при использовании рассматривае- 
мои системы, но и других, и решается она либо методами верифи- 
кации результатов распознавания, либо дополнением исходной 


базы данных специальными образами — «ловушками» [Кис99а]. 
Итак, представленная система не дает гарантии идентифика- 
ции «посетителей». На результат 


распознавания влияют много- 
численные факторы: плохое освещение, 


с размер исходного образа, 
не соответствующий базовому, дополнительные элементы на лице, 
неполное соответствие формы и вариантов предъявленных обра- 
зов образам в исходной базе д 


анных. 
Рассмотренный выше п 


























® высокое качество распознавания, исключающее ложное при- 
нятие решений; 

® относительно несложные алгоритмы, обеспечивающие высо- 
кое быстродействие решения задачи распознавания; 

® простые способы настройки (переналадки) системы под но- 
вую базу данных. 

Высокое качество распознавания возможно при исчернываю- 
ще полной исходной базе данных и совер 


енстве используемых 
методов (см., например, разд. 2), а также при предобработке новых 
образов (например, специальной нормализации, приводящей их к 


стандартным образам). Кроме того, высокое качество распознава- 
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ния может поддерживаться за счет процедур верификации при- 
нятых алгоритмом распознавания решений. 

Верификация принятых решений реализуется на практике 
несколькими способами [Т.ап97, Кис99а, Кис00, Реп00, Ноп98]. 

1. Контрольной проверкой/верификацией путем распознавания 
дополнительного образа или наиболее информативной его части. 

2. Использованием в одной системе двух разных алгоритмов 

распознавания, из которых один всегда основной, а другой допол- 
нительный, исполняющий функции верификатора (например, ал- 
горитмов, основанных на [511100] и обычной корреляции). 

3. Использованием персональных номеров идентификации 
(англ. РИМ), играющих роль пароля. 

4. Комплексированием источников биометрической информа- 
ции и их обработкой в одной системе распознавания (например, 
лицо + отпечаток пальца, лицо + голос, лицо + глаз). 

5. Использованием (анализом) признаков, относящихся к раз- 
личным категориям, но принадлежащих одному и тому же рас- 
познаваемому образу (например, математические и структурные 
признаки) и т. д. 

С учетом всего отмеченного выше, система распознавания «оп- 
Цпе» должна иметь разветвленную структуру, один из возмож- 
ных вариантов которой представлен на рис. 6.1.6. Главными бло- 
ками здесь являются: 

1) цифровая камера — источник исходного изображения; 

2) блок предварительной обработки изображений с камеры, 

включающий: 

блоки выделения собственно лица из целого изображе- 
ния — исходного образа и блоки выделения деталей лица; 
блоки нормализации исходного образа и согласования раз- 
меров; 
блоки элиминирования поворотов и наклонов изображе- 
ния головы и т. д. 

3) исходная база данных; 

4) виртуальная база данных; 

5) блоки выбора признаков; 

6) блок, реализующий основной алгоритм распознавания; 

Т) блок, реализующий дополнительный алгоритм распознава- 

ния; 

8) блок принятия решений; 

9) блок ввода РИМ или блоки ввода других ключей; 

10) блок, отображающий результат распознавания; 

11) блок анализа результатов распознавания. 

Исходная база данных комплектуется либо из разнородных ис- 
точников (фотографии, другие базы и источники данных), либо из 
изображений, поступающих непосредственно с камеры. Каждое 
изображение при этом проходит этап предварительной обработки: 
(выделение изображения лица из исходных изображений; выделе- 
ние деталей и регионов лица; подготовка различных эталонов — 
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Рис. 6.1.6.`Структура системы распознавания 
«оп-Ппе» | 


а нос, рот; согласование раз- 
меров выделяемых изображений в соответствии с заданными; нор- 

я ‘ ; 
мализация изображений относительно освещения; определение 
т. д. Сюда же мо тне- 
сти и вторичные задачи — определение н + ом 


по одному эк- 
образами, полученными из 


у трования рамками меньшего 
размера, выделения отдельных регионов из исходных данных, а 
, 


также их перемасштабированием (например, для получения пи- 
рамиды изображений). 1 

` Поскольку в рассматриваемой системе мог 
ны основной и дополнительный алгоритмы р 
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признаков (категория, их параметры, размер признакового про- 
странства) имеет здесь принципиальное значение. Как выбирать 
признаки и какие, мы уже описывали в разд. 2.3.4 и в гл. 5. 
Далее опишем выбор признаков применительно ко всем рассматри- 


ваемым ниже системам распознавания и с учетом реализуемых 
в них алгоритмов. 


В блоке принятия решений осуществляется вторичная обра- 
ботка результатов распознавания. Именно здесь принимается ре- 
шение о повторном (дополнительном) распознавании другого ис- 
ходного образа в случае неразрешенных альтернатив и включе- 
нии механизмов дополнительного алгоритма распознавания или 
ключей контроля результата распознавания. В качестве послед- 
них используют отпечатки пальцев, голос, радужную оболочку глаза, 
руку, РИ\, для которых используются специальные алгоритмы и 
методы распознавания, комплексируемые с основной системой рас- 
познавания по лицу. 

Блок отображения результата может выдавать результат рас- 
познавания в различных аудиовизуальных формах. Главное на- 
значение этого блока — дать сигнал, соответствующий получен- 
ному результату распознавания, и активизировать блок анализа и 
систему в целом на реализацию следующего акта распознавания. 

Блок анализа предназначен для накопления информации о 
результатах распознавания при выбранных параметрах системы 


и через него могут пополняться базы данных на этапе синтеза 
системы распознавания. 


6.2. ВИРТУАЛЬНЫЕ БАЗЫ ДАННЫХ 
И ВЫБОР ПРИЗНАКОВ 


В настоящем разделе сделана попытка обсуждения проблемы 
неполноты исходных данных и в связи с этим обосновать вклю- 
чение виртуальных баз (ВБ) данных в структуру систем распозна- 
вания. Здесь же обсуждаются вопросы о том, какие данные необ- 
ходимо*одержать в ВБ и чем руководствоваться при этом, как и 
какие выбирать признаки из имеющихся данных для достиже- 
ния наилучшего результата. 

‚ В процессе интеграции данных в исходной базе данных (ИБ), 
все образы имеют как бы одинаковый ранг: еще не решен вопрос, 
какие из них будут использованы для синтеза (обучения) систе- 
мы распознавания, а какие — для контроля. По существу, это 
файл данных с открытым доступом. 

В виртуальной базе ранг данных уже определен и с ВБ непо- 
средственно «работает» система на этапе обучения, контроля и 
анализа результатов распознавания. Если возникает необходимость 
пополнения базы данных образами, дополнительно синтезирован- 
ными из исходных данных или удачно распознанными образами, 
то и здесь можно не выходить за рамки ВБ. Принципиальное 
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отличие ВБ от ИБ состоит в том, что данные в ВБ прошли некото. 
рый этап трансформации из данных ИБ (например, сортировку — 
переупорядочение, переназначение или математическую Обработ. 
ку: каждый образ в ВБ представляет только часть образа исход. 
ных данных и т. д.). При этом способ трансформации исходных 
данных — ключ для структурирования ВБ и ключ/пароль ДЛЯ 
защиты от несанкционированного доступа к ней. 


Как уменьшить риск ложного распознавания? 


При идентификации посетителей или контроля доступа к чему- 
нибудь (например, к компьютеру, к базе данных или в помещение) 
с помощью систем распознавания «\У13Цог еп саНоп» возни- 


санкционированных пользователей подобных систем даже труд- 
но представить. Кроме собственно людей, стоящих перед видеока- 
мерой, но не являющихся санкционированными пользователями 
системы, к их числу, например, можно отнести всевозможные об- 
разы, предъявленные для распознавания, но не относящиеся к 
классу изображений лица живого человека (например, фотогра- 
а, изображения ладони, напомина- 
а также другие изображения, издали 
напоминающие выделенный образ лица. Именно относительно 
ованных пользователей любая исход- 


олной: она всегда будет иметь ограни- 
ченное число классов и ограниченное число образов в классе. 


ных предметов, напоминающих овал лица, ит. д. 

В рассматриваемых системах «У1зНог Таепысаноп» [Кух99ь,а] 
эта дополнительная база данных подключалась к ВБ и составля- 
ла с ней единую базу. По существу, такие дополнительные образы 
ВБ были предназначены если Не для полного исключения ложно- 
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го распознавания, то хотя бы для значительного уменьшения его 
риска. 

Обратимся к рисунку 4.1.9а, представляющем ВБ данных си- 
стемы класса «\У1зКог 14епйсайоп» [Кух99Ъ,4]: здесь образы с 
номерами 1 — 9 представляют пользователей системы распознава- 
ния (т.е. группу 1), а образы под номерами 10-17 — групиу 2. 
Если в процессе распознавания новый образ был квалифициро- 
ван как относящийся к группе 2, то он обозначается (определяет- 
ся, фиксируется) как образ, не относящийся к санкционирован- 
ным пользователям. 

Итак, для уменьшения риска ложного распознавания посети- 

телей системы, не принадлежащих ИБ и не являющихся санкци- 
онированными пользователями, а также образов, не относящихся 
к лицам (например, рука, рисунок лица ит. д.), в ВБ следует вклю- 
чить образы, принадлежащие группе 2. Естественно, это несколь- 
ко усложняет процесс распознавания, но главное, увеличивает об- 
щий объем данных в ВБ и усложняет ее структуру. Однако ВБ 
данных может существовать, а может и не существовать в явном 
виде. Это зависит от класса системы «оп-Нпе» (области ее исполь- 
зования или сферы применения), от методов трансформации дан- 
ных из ИБв ВВ, от необходимости и частоты извлечения данных 
из ВБ, от частоты, способа и сложности переналадки системы рас- 
познавания на новые данные. В конце концов, это может зависеть 
и от емкости памяти, предназначенной для реализации системы 
распознавания. 


Целый образ лица или его часть: что важнее? 


Самые простые системы распознавания «У1зЦог 4епЯсайоп» 
[55100] используют изображения не ИБ данных, а их уменьшен- 
ные копии, которые могут не храниться в памяти в явном виде. ВБ 
в таких системах играет промежуточную роль: яркостные призна- 
ки уменьшенных копий исходных изображений можно хранить в 
матрице признаков, где каждый, например, столбец будет представ- 
лять собой признаки одного исходного изображения. Однако клю- 
чом доступа к данным в этом случае будет новый формат пред- 
ставления данных: степень и способ их компрессии (уменьшения) 
и способ конкатенации матрицы исходного образа в вектор. 
Анализ самой простой системы распознавания «\15 ог Т4еп- 
{1 Нсайоп», проведенный в разд. 6.1, показал, что на результат рас- 
познавания влияют буквально все «внешние» факторы: плохое 
освещение в поле зрения камеры, несоответствующее удаление 
объекта распознавания от камеры, «мешающие» элементы на лице, 
неполное соответствие окружающего лицо фона, формы и вариан- 
тов предъявленных образов образам в ИБ данных. 
Предложенный в [31100] способ уменьшения влияния пере- 
численных нежелательных факторов на результат распознавания 
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состоит в пополнении ИБ данных различными вариантами ос. 
зов-эталонов в каждом классе. Именно вариации освещения“ 
удаления, ... фона ит. д. в образах-эталонах призваны обеспечи" 
некоторую относительную полноту ИБ данных и благодаря этом, 
улучшить результативность распознавания. 3 

Однако собрать в ИБ все естественные вариации об 
лонов практически невозможно, да, пожалуй, и не нужно. Это Можно 
сделать искусственно в рамках ВБ данных, используя имеющую. 
ся информацию из различных классов ИБ данных. Покаже 
на примере пополнения ВБ новыми образами-эталонами 
щими различный масштаб. При наличии в ВБ таких 
эталонов можно практически исключить задачу согласова 
меров новых образов в процессе их распознавания, поскольку в ВБ 
уже находится образ-эталон необходимого размера. 

Итак, пусть ИБ данных будет содержать по одному изображе- 
нию в каждом классе и это изоб 


ражение включает лицо человека 
и окружающий его фон. И пусть нам известно, что расстояние 
между центрами глаз для всей совокупности образов ИБ данных 
изменяется в пределах от 5; до 5 вах. На основе одного исходно- 
го изображения, полученного непосредственно с камеры, сформи- 
руем @ образов-эталонов (образов лиц) с размерами между цент- 
рами глаз, определяемыми как: Зи, Виш 1, Зи +2,..., 5: +(@- 
ЗЕ 

Описываемый процесс показан на рис. 
го изображения вначале выделяется 
затем определяется параметр В — первоначальное расстояние 
между центрами глаз. 


Используя далее методику, описанную в разд. «Согласование 
размеров изображений», и значения параметра 5 =5 1, Эа + 
+1, бы +2, ..., бишь + (@- 1), получим новую совокупность обра- 
зов для заданного класса. 

Из исходного изображения (см. рис. 6.2.1) получаем, например, 
12 новых образов-эталонов (рис. 6.2.2). Над каждым из образов 
указаны вычисленные значения расстояний между центрами глаз. 


Разов-эта. 


М это 
‚› ИМею- 
образов- 
ния раз- 


6.2.1. Здесь из исходно- 











Рис. 6.2.1. Центрирование распознаваемого образа и оценка расстояния В 
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Рис. 6.2.2. Двенадцать образов-эталонов и вычисленные для них расстояния и 


Обратим внимание на один факт — повторение оценок величи- 
ны В при некотором заметном даже «на глаз» изменении масшта- 
ба образов-эталонов. Иными словами, здесь на лицо результат не 
совсем точного определения величины В вследствие трех причин: 
согласования размеров изображений по критерию аьз(В - 5) <5, 
выбора величины 5 > 1, имеющей целочисленное значение, и оцен- 
ки величин В в числе пикселей, также имеющих целочисленное 
значение. 

К слову сказать, отмеченная ошибка в определении величины 
Е практически ни на что не влияет в дальнейшем, а каждый новый 
образ-эталон в ВБ повышает результативность распознавания. 

Итак, все полученные образы-эталоны теперь составляют один 

из классов ВБ. Как теперь, используя только эти до некоторой 
степени «виртуальные данные», идентифицировать посетителя, если 
его образ получен в измененных условиях (по отношению к усло- 
виям получения изображения в ИБ). н 

Рассмотрим, например, случай, связанный с изменением фона 
на изображениях и изменением прически, и оценим принципи- 
альную возможность идентификации такого образа. 

Пусть для посетителя рассмотренного выше класса (в данном 
случае третьего класса в соответствии с ИБ, представленной на 
рис. 6.1.1) получено непосредственно с камеры новое изображе- 
ние, а из него выделен образ для распознавания. Этот выделен- 
ный образ представлен на рис. 6.2.3а с правой стоны, а с левой 
строны на том же рисунке — один из образов, показанных на 
рис. 6.2.2 и принадлежащих ВБ. Из ВБ выбран именно тот образ, 
который согласован по размеру с выделенным новым образом. 

Из рис. 6.2.За отчетливо видно, что образы получены в разных 
Условиях (фотографии получены с одной и тои же камеры, для 
одного и того же человека, но в разное время), и вряд ли можно на 
100 % утверждать, что на обеих фотографиях одно и тоже лицо. 
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Образ для распознаь АНИ 





Взаимная 
корреляция 


между образами = 0,36 





Рис. 6.2.3а. Образ из ВБ и образ, предназначенный для распознавания 


Именно поэтому об использовании нормированной функции пока- 
зателя подобия тут вообще не может идти речи. 

Как известно, мерой подобия двух цифровых изображений мо- 
жет служить коэффициент их взаимной корреляции. Однако здесь 
мы имеем дело со специфическими изображениями лиц человека. 
Вся известная совокупность таких изображений принадлежит как 
бы одному гиперклассу, поскольку в центре каждого изображения 
находится лицо человека, а последнее включает в себя одинаковые 
для всех изображений части — брови, глаза, нос, рот, овал лица ит. д. 

Индивидуальные черты лиц (а именно брови, глаза, нос, рот, овал 
лица), а также фон/текстура на изображениях в общем случае могут 
изменяться не столь значительно, чтобы почувствовать их в изме- 
нениях амплитудной двухмерной взаимной корреляции: последняя 
более чувствительна к изменениям в низкочастотной части, кото- 


корреляцию, а фазовую [Све94], чувствительную ко всем измене- 
ниям индивидуальных черт лиц [Кис99]. 

Если же оценить меру подобия этих образов с помощью фазо- 
вои взаимной корреляции, то в данном случае она составит вели- 








Рис. 6.2.3Ъ. Части образов лиц, представленных на рис. 6.2.3а 
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чину, примерно равную 0,036, что также не может свидетельство- 
вать о близком подобии этих образов. 


В разд. 4.1 мы отмечали, что наиболее информативной и неиз- 
менной областью лица является его средняя часть и именно та, 
которая определяется эталоном № 3 (6 


рови, глаза, нос), представ- 
ленным на рис. 4.1.2. Для рассматриваемых выше образов эти час- 


ти лиц показаны на рис. 6.2.3Ъ. Здесь уже, пожалуй, со значи- 
тельно большей долей уверенности можно утверждать, что на обоих 
образах представлено лицо одного и того же человека. 


Подтверждением тому служит и взаимная (опять же фазовая!) 
корреляция между выделенными частями образов: здесь она со- 
ставляет уже величину, равную 0,73, что явно свидетельствует о 
подобии двух представленных образов. 

Заметим, что в обоих случаях мы использовали фазовую кор- 
реляцию (см. разд. 3.2) образов, которые перемасштабированы к 
размеру 16х 16 пикселей, что соответствует требованиям систе- 
мы «У15Цог еп саЯоп» [31100]. 

Анализируя полученные результаты, можно отметить следую- 
щее. Низкая корреляция между первыми образами (рис. 6.2.3а) 
обусловлена в меньшей степени различиями их яркости, фона и 
некоторыми различиями в масштабе (удалении от камеры в момент 
съемки), в значительно большей степени — различиями в тонких 
чертах лица (линия бровей и ресниц, линия переносицы, губ, область 
рта), в овале лиц, а главное — форме причесок. 

Однако и корреляция между вторыми образами (рис. 6.2.3Ъ) 
не достигла значения, близкого к 1, что также обусловлено разли- 
чиями в тонких чертах лица (см. например, линию бровей, ресниц 
и переносицы) и остаточным влиянием части прически (см. пра- 
вый верхний угол левого образа), а также, возможно, некоторым 
несоответствием масштабов представления этих образов. Напом- 
ним, что в рассматриваемых здесь методах точность согласования 

размеров двух образов зависит от оценки расстояния между цен- 
трами глаз, которая, в свою очередь, определяется с ошибкой 6, о 
чем писалось выше. 

И все же во втором случае получено подтверждение того, что 
образы на рис. 6.2.3 представляют одного и того же человека. 

Чтобы убедиться в уникальности этого результата в общем 
случае, выполним полный эксперимент — вычислим взаимную 
корреляцию между образами ВБ (см. рис. 6.2.2) и образами этого 
же класса, предназначенными для идентификации. 

Вся совокупность образов, которые можно получить из исход- 
ного изображения для всего диапазона изменений параметра $ 
от 25 до 32 пикселей, показана на рис. 6.2.4. В нашем экспери- 
менте получено 14 новых (можно сказать виртуальных) образов. 

Все их можно рассматривать как образы, имитирующие прибли- 
жение посетителя к цифровой фотокамере в системе «У13Ког 
Чет саНоп» и, следовательно, как образы, каждый из которых 
может быть предъявлен для идентификации посетителя. 
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Рис. 6.2.4. Образы одного и того же класса с разным масштабом их представле- 
ния, имитирующие приближение посетителя к камере в системе 
«У13Цог Таеписайоп» 


При этом выделенные части лиц из образов, показанных на 
рис. 6.2.2 и 6.2.4, показаны на рис. 6.2.58 и 6.2.5Ъ соответственно. 
Для наилучшего визуального сопоставления образов на этих ри- 
сунках они выполнены практически в одном и том же масштабе. 
Даже при самом беглом просмотре образов на рис. 6.2.5а и 6.2.5 
можно отметить их сходство между собой. 

А теперь вычислим коэффициенты взаимной фазовой корреля- 
ции между соответствующими совокупностями образов. Получен- 
ные значения взаимной корреляции (12: 14 =168 значений) пред- 
ставлены ЗО)-графиками (рис. 6.2.6). Здесь левый график — вза- 
имная корреляция между образами, представленными на рис. 6.2.2 


и 6.2.4, а правый — взаимная корреляция между образами, пред- 
ставленными на рис. 6.2.5а и 6.2.5Ъ. 

















—— 











Рис. 6.2.5. Выделенные части лиц из образов, 


показанных на рисунках 6.2.2 
и 6.2.4 
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Рис. 6.2.6. Результаты оценки взаимной корреляции между образами ВБ и обра- 
зами, предъявленными для распознавания, а также между частями этих образов 


ляции на правом графике равно 0,46, а максимальное значение 
значительно превосходит величину 0,5 и составляет 0,75. 

При этом обратим внимание на то, что во втором случае кор- 
реляция становится больше 0,5 только тогда, когда В > 28, посколь- 
ку при значении В=28 и В=29 (в данном конкретном случае) 
происходит более или менее точное согласование размеров обоих 
образов. Именно здесь отмечается максимум корреляции (его 
положение отмечено на графике стрелкой). 

При значениях В>29 наиболее информационная часть лица 
занимает всю область распознаваемого образа, а фон и «мешаю- 
щие» элементы на образах (например, волосы на верхних образах 
рис. 6.2.5) постепенно исключаются из рассмотрения. 

На основании отмеченного можно сделать вывод, что во вто- 
ром случае подобие образов можно считать полностью доказан- 
ным, и, следовательно, образы на рисунках 6.2.5а и 6.2.56 — это 
лицо одного человека. 

Поскольку полученные результаты обсуждаются в приложении 
к системам класса «У1зЦог ТаепайЙсаоп» (в том числе и описан- 
ным в [31100], представим также нормированную функцию по- 
казателя подобия (НФПП) для данных рис. 6.2.5а и 6.2.55. Эта 
функция, содержащая также все 168 значений, представлена в фор- 
ме 3)-поверхности на рис. 6.2.7. В данном случае среднее значе- 
ние НФПП равно 0,59, а максимальное — 0,73, что и | 
о принадлежности образов на рисунках 6.2.5а и 6.2.56 одному и 
ве. ое ОКя следует проверить, каковы показатели подобия 

распознаваемого образа (из класса 3) аналогично выбранным об- 


разам гих классов ВБ? 
ее т на рис. 6.2.8 представлены выбранные обра- 
зы из 12 классов ВБ, а цифрами 1- 12 обозначены номера клас- 
бразы. 
сов, которым принадлежат эти о . 
В т оьв контрольного образа выберем 10-й из совокупности 
образов, представленных на рис- 6.2.5Ъ. Именно для этого образа вычис- 
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Рис. 6.2.7. Результаты оценки нормированной функции по- 
казателя подобия между образами, представленными 
на рис. 6.2.5а и 6.2.55 


1 — максимум, соответствующий наилучшему согласованию между 
собой размеров двух образов из совокупностей 6.2.5а и 6.2.5Ъ; 2 — 
максимум, соответствующий случаю, когда выделенные части лиц 
занимают всю область в поле рамки образов 


ленное расстояние между центрами глаз составило 28 пикселей, что и 
определило локальный максимум корреляции на рис. 6.2.6. 

Вычислим теперь два оценочных показателя — взаимную кор- 
реляцию и НФПИ между контрольным образом и всеми образа- 
ми рис. 6.2.8 (включая и 3-й образ). Результаты этих оценок пред- 
ставлены графически на рис. 6.2.9, где на оси -- соответствую- 
щие оценки, а на оси Х — номера классов. 

Анализируя представленные результаты, отметим, что конт- 
рольный образ более всего подобен образу, принадлежащему именно 
третьему классу. Оба показателя подобия (корреляция и НФПП) 
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Рис. 6.2.8. Выделенные части лиц из образов 12 классов 
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Взаимная корреляция 














Рис. 6.2.9. Результаты оценки взаимной корреляции и НФПП между контрольным 
образом и образами, представленными на рис. 6.2.8 


здесь превышают 0,7, в то время как показатели подобия с други- 
ми образами практически не превосходят величины 0,5. 

Итак, выполненные эксперименты показали, что наиболее зна- 
чимой частью рапознаваемого класса изображений является сред- 
няя часть лица, определяемая эталоном № 3 (см. рис. 4.2). Обра- 
зы, полученные на его основе, должны быть включены в состав ВБ 
и именно по ним может и должна выполняться идентификация 
личности человека. 

Однако, как оказалось, наряду с использованием метрики Гу и 
основанной на ней нормированной функции показателя подобия 
образов в системах «\У1зЦог 1Чеп Нса#оп» для ценки подобия двух 
выделенных образов можно использовать и взаимную корреля- 
цию. Оценки подобия образов, полученные этими двумя способа- 
ми, дали практически одинаковые качественные результаты, хотя 
численные оценки взаимной корреляции были несколько лучше, 
чем оценки НФПП (оценка НФПИ вычислялась для 6=20). 

Таким образом, основной и дополнительныи алгоритмы рас- 
познавания, входящие в структуру системы распознавания (см. 
структуру на рис. 6.1.6), могут базироваться на упомянутых выше 


способах оценки. 

В заключение отметим, что дополнение каждого класса ВБ вы- 
деленными образами средней части лиц (разумеется, разного мас- 
штаба), а также применение основного и дополнительного алгорит- 
мов распознавания образов (фактически двух разных методов оцен- 
ки подобия) в одной системе «У1зЦог 14епЙсаЙоп» создает хорошие 
предпосылки для улучшения качества распознавания посетителей. 


Построение ВБ системы «У13Иог Т4епиЯсайоп» 


С учетом изложенного выше попробуем представить новую 


структ ВБ для обсуждаемого класса систем. Ве 
в ее № ВБ для систем класса «\У1зЙог деп Ясайоп» 


показан на рис. 6.2.10. Исходная база данных содержит здесь по 
одному изображению в каждом классе (одно изображение лица 
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Рис. 6.2.10. Пример построения ВБ из исходных данных 


для каждого человека, например, размером 112 х 96 пикселей). 
Однако каждый класс образов ВБ включает в себя два подобраза: 
один из них представляет уменьшенную копию целого исходного 
изображения, а другой — уменьшенную копию изображения сред- 
ней части лица. Новым элементом по сравнению с системами 
«У13Ког Т4епсаНоп» [31100] здесь является второй уровень 
подобразов в ВБ — уменьшенные копии изображения средней 
части лица. Как мы помним, выбраны они не случайно: средняя 
часть лица — не только более информативная, но и менее подвер- 
женная изменениям. 

Изображение средней части лица имеет размер 16х16 пиксе- 
лей, что позволяет сохранить в нем практически все индивиду- 


выполняется), что дополнительно уменьшает проблемы использо- 
вания метрики Ёо, связанные с циклическими сдвигами собствен- 
но лица в поле рамки 112х 96 пикселей. 








ВБ других систем и выбор признаков 


Если число образов в каждом классе слишком мало (один-два 
образа), то необходимо на основе имеющихся образов синтезиро- 
вать дополнительные и тем самым пополнить классы ВБ. 
Рассмотрим пример дополнения ВБ синтезированными обра- 
зами в каждом классе. Подход к такому дополнению, представ- 
ленный ниже, основан на идеях метода «Гусеница», описанного в 
[Гла97]. 
Итак, пусть исходная база данных содержит К классов образов 
(см. рис. 4.19) и по одному образу в классе. Положим, что в некото- 
рой системе распознавание реализовано на методах РСА + ПЛА, тре- 
бующих большого статистического материала. В нашем случае мы 
имеем дело только с одним образом в классе, а поэтому ВБ необхо- 
дима для ликвидации информационного дефицита. | 
Итак, пусть исходные образы имеют размер М х М пикселей. 
ВБ строится следующим способом: 
® в каждом классе образов ИБ с использованием эталона № 3 
(см. рис. 4.2) и процедуры выделения средней части лиц опреде- 
ляются центры глаз, вычисляется расстояние между ними, опре- 
деляются ось симметрии лица и положение линии глаз на исход- 
ном изображении; 

» далее из каждого образа ИБ выбирается @ подобразов, пред- 
ставляющих среднюю часть лица, путем сканирования исходного 
изображения по изменяемым относительно оси симметрии и ли- 


нии глаз значениям координат. г 
На рис. 6.2.11 обозначены два варианта (начальный и конеч- 
ный) выбора подобразов на изображении лица. В данном случае, 
например, рамка имеет размер М1 х/М: = 710 х 100 пикселей для 
исходного изображения размером М Хх № = 224 х 184 пикселя. 
Один из вариантов всех таких подобразов представлен на 
рис. 6.2.12. В данном примере в результате сканирования 


т 

















Исходное положение рамки фиксирует- 
ся относительно оси симметрии лица и по- 
ложения линии глаз. Далее сканируется все 
изображение по фиксированным значениям 


координат, изменяемым относительно оси 








симметрии лица и линии глаз. 








ыбора подобразов из исходного изображения лица 


Рис. 6.2.11. Варианты в 
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Рис. 6.2.12. Образы ВБ, полученные из образа первого класса ИБ 


исходного изображения получается 25 подобразов, каждый 
размером М, хМ, пикселей (70х 100 пикселей). 

Исходные признаки определяются при этом значениями пик- 
селей подобразов, что составляет М: хм/, т.е. (70х 100 = 7000 
признаков) для каждого подобраза. А все признаковое простран- 
ство для одного класса ВБ определяется М.М 1 признаками, в дан- 
ном случае 25х 70х 100 = 175000 признаками. 

Если учесть, чтов ИБ имеется больше одного класса данных, то 


бы значительных объе- 
спознавания базируется 

5, и эти © подобразов 
я матриц ковариации и 
ного пространства при- 


мов памяти. С другой стороны, система ра. 
на методах РСА + ГРА, описанных в гл. 
необходимы только на этапах вычислени 
выполнения процедуры редукции исход 
знаков. 

Число признаков после их редук 
соответствует числу (К - 1) для кажд 
классов. Редуцированное пространст 
ваемого случая составит @К(К - 1) 
образов в классе и по (К - 1) призна 
этом @К(К -— 1) < @М,М.. 

Отметим при этом, что необходимости в длительном хранении 
информации о подобразах — исходном признаковом простран- 
стве — нет, поэтому ВБ выступает здесь в неявном виде. Для даль- 
нейшего использования при распознавании в памяти сохраняются 


ции по методам РСА + [РА 
ого подобраза, гдеК — число 
во признаков для рассматри- 
признаков: К классов, © под- 
ков на каждый подобраз. При 
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@К(К - 1) признаков редуцированного пространства, матрицы ре- 


дукции пространства признаков, параметры системы и информа- 
ы ция о расстоянии между центрами глаз в каждом классе образов. 
`. Итак, главный эффект от дополнения ВБ выбранными образа- 
| ми в каждом классе состоит в возможности применения в систе- 
ме распознавания мощного математического аппарата методов РСА 
ь и ГРА при «статистической неполноте» исходных данных. 
С Теперь остановимся на новой проблеме, также присущей сис- 
| $ темам распознавания, которые работают в режиме «оп-Ппе» с ка- 
+ мерой (вариации освещения). 
Как бы мы ни старались пополнить ИБ изображениями с раз- 
ыы личной степенью яркости или как бы ни старались нормализо- 
: - вать яркость исходных изображений, нам не удастся полностью 
. % элимировать яркостную компоненту в пространстве редуцирован- 


ных признаков. В процессе рапознавания нового образа эта ком- 


а понента будет играть определенную роль, а значит, результат рас- 
„в познавания будет зависеть от яркости распознаваемого образа. 
‚ > В случаях, когда яркостная признаковая компонента приобретает 


тлавную роль, а форма и детали лица — второстепенную, необходи- 
мо перейти к категории других признаков, например, к нормирован- 


@ | ным градиентам яркости. 
588 На рис. 6.2.13 представлено исходное изображение лица 1, сред- 
з В няя часть лица, соответствующая фрагменту, выделенному рам- 
кой 2, а также варианты градиентов яркости, отмеченные цифра- 


ми 3-5. 
Образ 3 соответствует суммарному градиенту яркости но оси Хх 
И" иу, образ 4 — градиенту яркости по оси Х, а образ 5 является гра- 














Рис. 6.2.13. Исходный образ, выделенный фрагмент и его градиенты 
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диентом яркости по оси У. Здесь представлены градиенты, нор; 
рованные по (4.2). Перед тем как из них выбирать признаки 
значения пикселей, нормированное изображение градиентов цент 
рируется на среднее значение изображения. 


Главный эффект такого выбора признаков — практическое эли. 


6.3. СИНТЕЗ СИСТЕМЫ «УТЗТТОЕ ШФЕМТИЕСАТТОМ» 


Представим несколько новых вариантов построения систем 
класса «У13 ог Тепа са оп», в которых предусмотрены различ- 
ные способы повышения точности идентификации посетителя, а 
также предусмотрена верификация результата его идентифика- 
ции/распознавания. В этих вариантах будут реализованы новые 
подходы как в процессе синтеза собственно системы «\У1з ог Т4еп- 
ИНсаНоп», так и в процессе решения системой основной задачи — 
идентификации /распознавания посетителя. 

. Варианты ностроения системы при ее синтезе основаны на 
следующих подходах [Кис99ь, Кис00а, Кис00а, Кух 99Ь, Кух99а]: 

— дополнении ВБ совокупностью данных, представляющих 
образы соответствующего класса ИБ, но отличающихся друг от 
друга размерами (что имитирует приближение/удаление посети- 
теля к камере в момент сеанса с ним). 

— формировании из исходных данных образов, предназначен- 
ных как для синтеза/обучения системы «У15Ког 14еписайоп», 
так и для контроля работы системы. 

— встраивании в систему и совместном использовании в ней 
двух разных процедур классификации распознаваемого образа, из 
которых одна основная, а другая дополнительная, исполняющая 
функции верификатора. 

— апробировании работы системы на примере идентифика- 
ции контрольных образов с целью оценки эффективности систе- 
мы (или, например, оценки параметров, порогов или критериев), 
при которых обеспечивается уверенная работа системы по реше- 
нию задачи идентификации и при этом обеспечиваются некото- 
рые требуемые (минимальные) уровни ошибочных отказов (№а1зе 
ге]есф габе — ЕВВ) и ошибочных подтверждений (Ра13е ассерфапсе 
гаёе — РАВ [Ноп98, Фил00]). Ё 

2. Варианты построения системы в части, реализующей проце- 
дуры распознавания и верификации результата распознавания, 
основаны на следующих подходах [Кис99Ъ, Кис00а, Кис00а]: 

— использовании в одной системе двух разных процедур клас- 
сификации распознаваемого образа, из которых одна основная 


194 








р он 


(имеющая высший приоритет), а другая дополнительная: иена 
няющая функции верификатора; х 

— выполнении распознавания не только по исходному (всему) 
образу. лица, но и по его наиболее информативной части (анало- 
гичной, например, эталонам № 2 и 3 из рис. 6.2.2), что призвано 
обеспечить более высокую точность идентификации; 

"_ верификации первоначального результата распознавания 
за счет контрольной проверки — распознавания дополнительных 
образов (двух или четырех), полученных непосредственно из ис- 
ходного изображения путем его перемасштабирования, и исполь- 
зования мажоритарного принципа оценки результата распозна- 
у, вания (по двум из трех или по трем из пяти); 

— использовании РП\, вводимых пользователем (посетителем) 
в систему по ее запросу. 

Рассмотрим конкретный пример. Пусть проектируемая сис- 
Ч. тема «\У13Ког еп саюоп» предназначена для идентификации 
ИтелЯ, семи пользователей (семи санкционированных посетителей), фо- 
тографии которых представлены на рис. 6.3.1. Для каждого из 
них в ИБ данных имеется только по одному изображению, полу- 
ченному в условиях, в которых будет работать система. 

Процесс синтеза данных ВБ на примере образов первого клас- 
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Задачи — са представлен на рис. 6.3.2. 

Здесь из единственного изображения (отмечено цифрой 1), по- 
раны #8 лученного непосредственно с видеокамеры, выделен первоначаль- 
Кух9 } ный образ лица (отмечен цифрой 2). На этом образе определены 
ЯЮЩИ координаты центров глаз и расстояние В между ними. Далее на 


[1 основе этих оценок определяются ось симметрии лица и положе- 
Е ние линии глаз (см. белые линии на выделенном образе 3). 

Поскольку эти и последующие операции на изображениях 
. выполняются в автоматическом режиме, по расстоянию В, поло- 
т жению оси симметрии лица и линии глаз можно судить о пра- 
ео" вильности работы алгоритма выделения первоначального образа, 
й точности определения координат центров глаз, а также о разнице 
в координатах центров глаз по оси У. Эта информация позволяет 
А, принять решение о необходимости использования процедур эли- 
минирования наклонов головы (в плоскости ХУ) или о необходи- 
мости получения другого изображения с видеокамеры. 
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Рис. 6.3.1. Семь санкционированных пользователей системы «\15Цог 14епсаНоп» 
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Если в результате выполнения перечисленных операций обра- 
ботки полученные оценки не выходят за рамки заданных ограни- 


ходное изображение (см. образ, отмеченный цифрой 4). Далее отно- 
сительно этой оси симметрии и положения линии глаз определяется 
базовая рамка размером 112 х 96 пикселей, в поле которой нахо- 
дится образ лица. Выбирая в соответствии с алгоритмом, представ- 
ленным в разд. 6.2.2, несколько подобных образов с рамками мень- 
шего и большего (относительно базового) размера и перемасштаби- 
руя их к одному и тому же размеру (112 х 96 пикселей), можно 
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получить Г образов лица с разными, но монотонно изменяющими- 
ся значениями величины К. В полученном ряду образов величина 
В меняется в пределах заданных значений отА„;‚ до Виах. Этот ряд 
имитирует приближение/удаление посетителя к камере в момент 
сеанса с ним. Полученные при этом образы-эталоны используются 
далее для получения из них соответствующих подобразов. Описан- 
ный поцесс представлен схематически в нижней части рис. 6.3.2. 

Контрольные образы получаются аналогичным способом. Один 
из образов определяется базовой рамкой на исходном изображе- 
нии, и этот образ точно соответствует одному из Г упомянутых 
выше. Два других образа определяются меньшим и большим (от- 
носительно базового) размером рамки. При этом изменения раз- 
меров рамки фиксированы некоторой величиной +Л и в общем 
случае не связаны с согласованием размеров по параметру В. 

Естественно, что описанный выше процесс синтеза данных ВБ 
повторяется для всех К классов образов. В рассматриваемом нами 
случае он повторился бы 7 раз. 

Далее в соответствии с методологией построения систем «У1зЦог 
14еп1са&оп» [Кух99, Кис00], образы-эталоны и контрольные об- 
разы, а также соответствующие им подобразы перемасштабиру- 
ются к размеру 16 х 16 пикселей. Каждый такой образ преобразу- 
ется затем (с помощью операции конкатенации) в вектор, содержа- 
щий 256 элементов, и записывается в память под номером своего 
класса. 

По окончании процедуры синтеза новых образов в памяти си- 
стемы «\У1зКог 14епЯсайоп» содержатся следующие данные: 

1) параметры системы — {К, Г, @}, 
где К — число классов; Г» — Чиело образов-эталонов в #-м 
классе, =1,2,..., К; @ = шах, То» Гл > к 
2) значения размеров всех используемых масок; 
3) значения порогов 5, используемых в метрике Го; 
4) К исходных изображений, полученных непосредственно с 
видеокамер; 
5) К изображений лиц поль 
ром 112 х96 пикселей); 
6) двумерный массив раз 
для хранения информации о ре 
- ных ‚ 
и размером Жи преданный для 
хранения значений координат Хи У опренернни о те 
сечения оси симметрии лица и линии глаз на исходных изобра- 
и трехмерных массива размером 256 БЕ >= 
щих образы-эталоны и соответствующие ‚рен ыы ии => 
ях, когда Г» <@, неиспользуемые столбцы 


нулями); 
9) = трехмерных массива размером 256 х3хК, определяю- 


щих контрольные образы и соответствующие им подобразы; 
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зователей (образов-эталонов разме- 


мером (@ +3)хК, предназначенный 
значениях величин В для всех обра- 








Прежде чем приступить к аппробированию работы систем»: ... 
примере идентификации контрольных образов, представим ее сту к. 
туру (рис. 6.3.3). При этом за основу примем структуру, предста». 
ленную на рис. 6.1.6 и описанную в разд. 6.1. Меру подобия мех. 
ду образами-эталонами и контрольным образом (или образа МИ 
эталонами и каждым новым образом) будем определять Двумя 
методами. Первый из них — основной — базируется на взаимной 
корреляции, а второй — дополнительный — на основе метрики И, 
На структурной схеме системы цифрами 1 и 2 обозначены посети. 
тель системы «У1Цог 1ЧепйЙсайоп» и исходное изображение, полу. 
ченное с камеры. Цифрами За, ЗЬ и 3с отмечены три выделенных из 
исходного изображения образа лица, предназначенных для иденти. 
фикации (в режиме тестирования системы это будут контрольные 
образы). Причем образ ЗЬ получен непосредственно из исходного изоб- 
ражения (без изменений его масштаба), а образы За и 3с соответству- 
ют удалению лица от видеокамеры и приближению лица к видеока- 
мере. В связи с этим на образе За изображение лица будет уменьшен- 
ным, на образе 3с — увеличенным по отношению к образу ЗЬ. 
Цифрами 3' отмечены перемасштабированные к размеру 16х 16 
пикселей образы За, ЗЬ и Зси соответствующие им подобразы — 
части лиц, представленные в форме векторов. Именно они сравни- 
ваются с образами и подобразами 4' всех классов данных из ВБ, 
также представленными в форме векторов. 

Цифрами 5 и 6 отмечены две группы результатов вычисления 
нормированного показателя подобия, основанного на метрике Гу — 
для целых образов лиц и их подобразов соответственно. Для К 
классов и Г, образов в каждом классе, в каждой группе получаем 
по КГ, оценок взаимной коореляции на каждый из образов 3'. 

Цифрами Т и 8 обозначены две группы результатов вычисле- 
ния взаимной корреляции — для целых образов лиц и их под- 
образов соответственно. Здесь также получаем по КГ, оценок по- 
казателя подобия в каждой группе и для каждого из образов 3'. 

Цифра 9 определяет окончание анализа результата классифи- 
кации нового образа и принятие решения. Далее идет отображение 
результата в случае успешной идентификации посетителя (линия с 
цифрой 10) и/или запись результата в протокол сеанса с посетителем 
(линия с цифрой 12). Цифра 11 — путь повторного запуска видео- 
камеры в случае отрицательного ре 


зультата распознавания. 
Положим, что основной метод классификации в данной систе- 
ме основан на взаимной корреляции. Дополнительным методом, 


выполняющим функции верификации, будет в таком случае ме- 
тод классификации на основе метрики Го. 

В случаях, когда результаты классификации по основному ал- 
горитму и верификации по дополнительному, являются одинако- 
выми, распознаваемый образ считается идентифицированным. 

В случаях, когда результаты классификации по основному ал- 
горитму и верификации по дополнительному, разные, распознава- 
емый образ считается неидентифицированным. 
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Рассмотрим теперь подробнее работу блока анализа резуль 
татов классификации и принятия решении. доб 

Будем считать, что блоком «Определение меры подобия обра. 

зов на основе корреляции» вычислены коэффициенты взаимной 
корреляции одного образа группы 3' (конкретно образа За, ЗЬ или 
3е) со всеми образами группы 4' (с каждым образом и в каждом 
классе). Из всей совокупности полученных оценок корреляции 
выбираем только максимальные значения. При этом для каждо- 
го из образов группы 3' (т. е. отдельно для образа За, ЗЬ или 3с) и 
соответствующих им подобразов получаем следующие оценки: 
® максимум корреляции для образа целого лица Ко(1); 

® максимум корреляции для подобраза лица — Кр(/); 

® максимум средней корреляции в классе для образа целого 
лица 60(1); 

® максимум средней корреляции в классе для подобраза лица 
Эр(т), гдев, „и т — номера классов (в перечислении их по ВБ), 
которым принадлежат максимумы. 

Будем также считать, что блоком «Определение меры подобия 
образов на основе метрики [4» получены оценки нормированной 
функции показателя подобия одного образа группы 3' (конкретно 
образа За, ЗЬ или 3с) со всеми образами группы 4' (с каждым 
образом и в каждом классе). Из всей совокупности полученных 
оценок показателя подобия выбираем только максимальные зна- 
чения. При этом для каждого из образов группы 3' (то есть от- 
дельно для образа За, ЗЬ или 3с) и соответствующих им подобра- 
зов получаем следующие оценки: 

® максимум показателя подобия для образа целого лица Ко(в); 

® максимум показателя подобия для подобраза лица Ер(=), 
гдевия — номера классов (в перечислении их по ВБ), которым 
принадлежат максимумы функции показателя подобия. 
исследований, выполненных на боль- 
ьных данных в соответствии с методи- 
.3, можно утверждать, что наибольший 
о принятия решений об идентифика- 
ции представляют следующие оценки: Кр + 5р, бо + 5р, Ро и Ер. 
Мы будем исходить из того, что вся совокупность оценок 
{Кр + 5р, 50 + 5р, Рои Ер} будет определять принадлежность каж- 
помо полок У бо В ному ему же 
тся одно из следующих условии: 


(Кр + 5р) > Р: при ]}=8; (6.3.1) 

(50 +5р) > Р» при # =}; (6.3.2) 

($0 + 5р) > Рз при 1 = (В+ #)/2; (6.3.3) 

(50 + 5р) > Р, при (#+]+1+т+ 1+ 2)/6 =2, (6.3.4) 

тдеР, = Ру некоторые установленные пороги, причем Р, > Р.> 
> РЫР 
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Из приведенных условий видно, что первое из них и последние 
два используют все вычисленные оценки, и здесь, таким образом, 
для подтверждения распознанного класса используется процеду- 
ра верификации. 

А теперь при окончательном принятии решения используем 
мажоритарный принцип. Напомним, что каждый новый посети- 
тель, которого предстоит идентифицировать, был представлен тре- 
мя образами, а именно За, 3 и 3с. Процедура их классификации 
выполняется последовательно: первым обрабатывается образ За, 

последним — образ 3с. Поэтому, если в процессе классификации 
два любых образа (например, За и ЗЬ, За и 3с или 3Ь и 36) будут 
отнесены к одному и тому же классу, можно считать, что иденти- 
фикация прошла успешно. При этом если к одному и тому же 
классу отнесены первые два образа (а именно, За и 35), то процесс 
дальнейшей идентификации можно прервать. 

Синтез каждой системы «У1зЦог еп саЙоп» заканчивается 
этапом идентификации контрольных образов из ВБ. Именно на 
этом этапе проверяется правильность функционирования систе- 
мы. Идентифицируемые контрольные образы естественно должны 
быть отнесены к своим классам. При этом дополнительным кри- 
терием правильности функционирования системы могут служить 
численные значения оценок {Ко(2), Кр), 50), р(т), Ео(®), Ер(а)}. 

На рис. 6.3.4 представлены результаты такой проверки для кон- 
трольных образов 5-го класса данных из ВБ. Нумерация рисунков 
соответствует обозначениям, используемым выше: образы с литера- 
Ми ОТ «а» до «с» соответствуют приближению лица к видеокамере. 





КОСНАНЕ\МУ 


8-55: 5 5 
55 5.5 





Рис. 6.3.4. Результат идентификации контрольных образов 5-го класса 
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Таблиц 
икации контрольных образов 


Результаты идентиф 







Для образа ЗЬ 









Для образа За 





0,55 0,48 
0,53 0,19 
0,64 | 0,32 
0,60 0,15 
1,00 1,00 
0,59 0,23 | 
0,57 0,19 















Для образа Зе 


кллоо [ко+ кр] 82| № | #2 | 


Цифры с левой стороны каждого образа — это сумма корреля- 
ции [50(1) + 5р(т)], выраженная в процентах, и номера классов {&, /, 
й, 8}, к которым был отнесен контрольный образ. Цифры внизу 
каждого образа обозначают сумму корреляции [Ко(1) + Кр(])], так- 
же выраженную в процентах, и номер класса, для которого эта 
сумма была максимальной. 

Численные значения всех оценок Ко(@) + Кр(}), 50(1) + $р(т), Ео(№) 
и Ер(2), полученные при выполнении теста идентификации конт- 
рольных образов, приведены в табл. 6.3.1. 

При правильной работе системы аналогичные значения оце- 
нок должны быть получены и при идентификации других клас- 
сов контрольных образов. 

Проверка работы системы заканчивается тестом пробной иден- 
тификации образов, как принадлежащих ВБ, так и не принадле- 
жащих ей. На этом этапе определяются пороги Р; — Р. и коррек- 
тируются условия (6.3.1 ) - (6.3.4). 

На рис. 6.3.5 приведены 15 тестовых образов, которые после- 
довательно (в порядке их нумерации) предъявляются системе 
для идентификации. Отметим, что среди них 7 образов принадле- 
жат санкционированным пользователям, (1, 3, 5, 6, 8, 11 и 15). 

Однако только образ с номером 15 отражает исходные данные 
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Рис. 6.3.5. 15 тестовых образов 


своего класса, поскольку получен из соответствующего изображе- 
ния, хранящегося в ИБ. Остальные образы (1,3, 5, 6, 8 и 11) не 
совсем точно соответствуют образам в ИБ (или ВБ), поскольку 
получены в разное время, при разных освещении и фоне, а также 
в разных условиях приближения к камере. 

Для оценки величин порогов Р! — Р4 и выбора конкретного 
условия идентификации из всех возможных вариантов условий 
(6.3.1) и (6.3.4) вычислим и представим оценки {Кр +5р, 50 + $р, 
Ро и Ер} для каждого тестового образа. 

Полученные значения сведены в табл. 6.3.2. Вся таблица со- 
стоит из 15 отдельных подтаблиц, в которых представлены ре- 


Таблица 6.3.2 
Оценка мер подобия 


Для образа 1 Для образа 2 


0,39 0,46 0,25 
0,36 0,45 
0,36 0,56 
0,37 0,52 
0,36 0,59 
0,37 0,53 
0,39 0,51 
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Для образа 3 
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Для образа 6 
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Для образа 8 
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Для образа 10 
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Продолжение табл. 6.3.2 


















































































\ Для образа 11 
к Зр | 3 
кл кллсо [рр [ 0582] № 
| ь и 0,36 | 0,34 | 0,14 
| [22222 0,36 | 0,34 | 0,16 
и 3 0,37 | 0,46 | 0,13 
ы 0,38 | 0,35 | 0,42 | 0,15 
ви | 0,38 | 0,35 | 0,47 | 0,11 
о" 0,38 | 0,37 | 0,38 | 0,10 
58 | па: 
№ 0,37 | 0,35 | 0,47 | 0,15 
т Для образа 14 
м 
и 
0,68 |049 
3 
08 |5 
(0,68 |042 
057 |0 
т 
| 09 № 
065 | № 
8 : 
| И й 
О 
05° | 
| 08 
‚22 | 
| о 
| 
|’ 
0, | (2 
9’ 
11 ь 
И бия 15 тестовых образов с 7 образами 
| 8 | зультаты оценки мер подобия 


из ВБ. 

Каждая выделенная подтаблица содер вх ме ыы 
рых размещены вычисленные оценки {Кр +5Р з о я АЯ 
для соответствующих классов. Результаты, опред : а мн = 
мальные значения вычисленных оценок для Е Я 29 

| делены полужирным шрифтом. |. пех в; ыы а " лежат ЖЕНЕ 
речислены номера классов {#, 1, №» а}, которым принад 


аза 
етного тестового образа. 
о. 2 оценки позволяют теперь обосно- 


табл. 6.3. 
м. бана Р‚— Ра- Фактинески эти величины содер- 
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Номера классов 





















Рис. 6.3.6. Тестовые образы, успешно прошедшие идентификацию (верхний ряд), 
и образы-эталоны, хранящиеся в ВБ (нижний ряд) 


жатся в первых двух столбцах таблиц (Кр + 5р) и (50 + 5р). Итак, 
пусть Р, = 1,0; Р.=0,7; Рз=0,65;Р. = 0,6. Дальнейший анализ дан- 
ных этой таблицы показывает, что успешная идентификация тесто- 
вых образов возможна при использовании любого из условий 
(6.3.1) - (6.3.4). Воспользуемся в таком случае условиями (6.3.2) 
и (6.3.3). 

Результат идентификации тестовых образов при заданных по- 
рогах и выбранных условиях (который прежде всего необходимо 


рассматривать как результат тестирования системы) представлен 
на рис. 6.3.6 и 6.3.7. 


При тестировании системы была о 


дновременно поставлена за- 
дача отсортировать по номе 


рам классов те образы, которые ус- 
фикацию. Именно этот результат представ- 
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Рис. 6.3.7. Тестовые образы, не прошедшие идентификацию (верхний ряд) 
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Рис. 6.3.8. Результат идентификации братьев-близнецов 


оставшихся не были идентифицированы вообще, а один иденти- 
фицирован неверно. Результаты эксперимента приведены на 
рис. 6.3.8. Здесь верхний ряд — образы, предъявленные для рас- 
познавания, а нижний ряд — образы из базы. 

А теперь в качестве тестовых образов возьмем образы из базы 
[0**] и проверим, насколько они «похожи» на образы из ВБ 
рассматриваемой системы «\У1зЦог Чет Иса&юоп». Оказалось, что 
при выбранных ранее порогах Р. = 0,7, Рз=0,65 и Р. =0,6 и трех 
вариантах условий (6.3.2) - (6.3.4) ни один из предъявленных 
образов не был идентифицирован (не найдено подобия их среди 
образов ВБ) как пользователь системы. 

Заметим, что при снижении порога Р. до величины 0,5 только 
два образа из 20 классов образов базы [Ог**] были «распознаны» 
как принадлежащие к пользователям системы. При этом лож- 
ная акцептация произошла по условию (6.3.4). Однако, как сле- 
дует из анализа данных в приведенных выше таблицах, значение 
порога Р. = 0,5 не может быть использовано на практике. 

Как видно из приведенных примеров, новая система «У13Цог 
еп саНоп» не идентифицирует образы, не принадлежащие соб- 
ственной базе. Из этого факта следует, что показатель КАВ в дан- 
ном конкретном случае стремится к нулю. 

В то же время нельзя определенно утверждать, что показатель 
ЕВВ также стремится к нулю. Распознавание образов, принадле- 
жащих к базовым, поддерживается на уровне близком к 100%, 
если образ «посетителя» является актуальным по отношению к 
образу в базе. Если образ, предъявленный для распознавания, не 
будет актуальным по отношению к образу в ИБ, может наступить 
ошибочный отказ. При этом под актуальным здесь подразумева- 
ется образ, который получен при некоторых одинаковых услови- 
ях, определяющих его (образа) биометрические характеристики, 
что и соответствующий образ ИБ. Отметим некоторые из этих 

Условий: 

® неизменные условия освещенности перед камерой; 

® одинаковый окружающий фон вокруг изображения лица; 
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® одинаковый пункт наблюдения (дающий, например, о. 


= * соответствие масштабов изображений лиц; 

® одинаковое эмоциональное выражение лица (мимика); 

» внешнее сходство двух лиц (или несущественные их отличия, 
не связанные с возрастными изменениями); 

е относительная неизменность внешнего вида лица (наприме р, 
той части лиц, где находятся усы и борода); 

® отсутствие разных предметов на лице (серьги, кольца, очки) и 
голове (шапки, банты, шляпки и платки); 

® относительная неизменность причесок и цвета волос; 

Фит. д. 

Все перечисленные условия получения исходных данных можно 
разделить на две группы: первая определяет как бы внешние, 
авторая — внутренние причины изменчивости биометрических 


ма выдает либо безус- 
либо в случае неоднозначности резуль- 
озможности принятия окончательного 


В описанной выше с 131 
истеме «\У13Цог аеписан 
еп саНоп» в каждом 
классе ИБ 
знаков РР щен один образ, а в качестве исходных при- 
Ривне ись яркостные признаки. Собственно распо- 
нялось в пространстве исходных признаков, силь- 





пешно, если его образ является ак 
разу в ИБ данных. При этом под 
ется образ, который имеет с соотв 
ковые в некотором смысле характеристики. Для рассмотренного 


класса систем это требование является обязательным, в против- 
ном случае происходит ошибочный отказ 
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актуальным здесь подразумева- 
етствующим образом ИБ одина- 











Среди систем распознавания «оп-Ппе» можно выделить отдель- 
ный подкласс — системы, предназначенные для контроля доступа 
(КД) к чему-нибудь: например, к компьютеру, семейным средствам 
передвижения (например, к автомобилю, яхте, самолету), базе дан- 
ных, индивидуальным и коллективным счетам в банках, собствен- 
ному оружию или в специальные помещения. Особенности этого 
класса систем — длительный срок их эксплуатации и существенно 
повышенные (в сравнении с системами класса «У1зКог ТаепыЯса® оп») 
требования к надежности идентификации пользователя. 

Очевидно, что в приложении к системам КД неактуальность 
образа пользователя становится главной проблемой. Последнее 
объясняется тем, что при длительной эксплуатации системы КД 
практически невозможно выдержать одни и те же условия полу- 
чения исходных данных. 

Очевидно и то, что полное решение возникших при этом про- 
блем невозможно, поскольку априори невозможно предусмотреть 
все случаи вариантов изменений исходных данных. Однако можно 
попробовать построить такую систему распознавания, которая будет 
робастной по отношению к некоторым изменениям условий по- 
лучения исходных данных и некоторым изменениям биометри- 
ческих характеристик образов — пользователей систем. Такая 
система распознавания может быть реализована на подходах, опи- 
санных в гл. 5 и разд. 6.2 и 6.3. 

Суть этих подходов состоит в следующем. 

В качестве исходных признаков выберем градиенты яркости, 
что позволит существенно элиминировать влияние изменений 
условий освещенности образов в момент сеанса с видеокамерой. 
И хотя теперь индивидуальные черты лиц представляются через 
пространство новых признаков к градиентов яркости, в данном 
случае все еще сильно ощущается непосредственное влияние дру- 
гих внешних и внутренних условий получения исходных образов 
на их биометрические характеристики. 

Поэтому для уменьшения этого непосредственного влияния не- 
рейдем от пространства исходных признаков к редуцированному 
пространству признаков. В нем и будем выполнять распознавание. 

Для того чтобы элиминировать влияние разности масштабов 
распознаваемых образов и образов-эталонов на результат распо- 
знавания, сформируем в ВБ (и в дальнейшем будем использо- 
вать) несколько образов-эталонов, имитирующих приближение/ 
удаление к видеокамере в момент сеанса с ней. 

И, наконец, в каждом из образов будем выбирать несколько 
подобразов, определяющих наиболее стабильную часть лица чело- 
века, чтобы уменьшить влияние внутренних причин изменчиво- 
сти на биометрические характеристики распознаваемого образа. 

Теперь рассмотрим конкретный пример системы КД, предназ- 
наченной для семи пользователей (семь пользователей было вы- 
брано для того, чтобы можно было сравнить эту систему с рас- 
смотренной ранее системой «У13 ог 14еп са Чоп»). 
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Рис. 6.4.1. Санкционированные пользователи системы 


Итак, исходная база данных содержит 7 классов образов и в 


каждом классе имеет по одному образу. Все семь санкциониро- 

ванных пользователей системы представлены на рис. 6.4.1. 
Процесс синтеза образов ВБ на приме 

вого класса представлен на рис. 6.4.2. 


ре исходных данных пер- 








Рис. 6.4.2. Процесс синтеза данных ВБ на примере исходного образа первого 
м класса 
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Здесь из единственного изображения, полученного непосред- 
ственно с видеокамеры, выделяется первоначальный образ лица. 


На этом образе определяются координаты центров глаз и рассто- 
А яние В между ними. Далее на основе этих оценок определяются 
Мы ось симметрии лица и положение линии глаз на исходном изоб- 

| & ражении (помечено цифрой 1). 
У \ Затем относительно этой оси симметрии и положения линии 
< глаз определяется базовая рамка размером 112 х 96 пикселей, в поле 
, > которой находится образ лица. Выбирая в соответствии с алгорит- 


мом, представленным в разд. 6.2.2, еще два подобных образа с рам- 
ками меньшего и большего (относительно базового) размера и нпе- 
ремасштабируя их к одному и тому же размеру (112 х 96 пиксе- 
лей), можно получить 3 образа лица (образы За, 3 и 3с) с разными 
значениями величины В. Этот ряд образов имитирует приближе- 
ние и/или удаление посетителя к камере в момент сеанса с ним. 
На каждом из образов За, 35 и 3с выбирается исходное поло- 
жение некоторой рамки, определяющей размер выбираемого с ее 
—— помощью подобраза. Далее выполняется сканирование с помощью 
этой рамки данных образов по значениям координат, которые 
изменяются относительно оси симметрии лица и линии глаз (см. 
в разд. 6.2). При этом из каждого образа За, ЗЬ и 3с получаем по 
9 подобразов. Описанный процесс представлен схематически в ниж- 
ней части рис. 6.4.2. 

Естественно, что синтез данных ВБ повторяется для всех К 
классов образов. В рассматриваемом нами случае он повторялся 
бы Т раз. 

Теперь переходим к градиентам яркости. Для каждого из под- 
образов вычисляются три градиента (рис. 6.4.3). 

При этом образ 1 соответствует суммарному градиенту яркости 
по оси Х иУ, образ 2 — является градиентом яркости по оси Х, а 
образ 3 — градиент яркости по оси У. Здесь представлены градиен- 
ты, нормированные по (6.2.2). Признаками теперь являются значе- 
ния градиентов в каждом пикселе. 

Редукция исходного пространства признаков реализуется мето- 
дами РСА и ГА в строгом соответствии © методикой, описанной в 
гл. 5. При этом от каждой матрицы градиентов остается только но 
(К - 1) признаку, где К — число классов образов в ИБ. Если каж- 
дая матрица градиентов имеет размер М х № пикселей, то исходное 
пространство признаков уменьшается при этом в ММК - 1 раза. 

В общем случае, по окончании процедуры синтеза новых обра- 
зов и редукции пространства признаков в памяти системы содер- 
жатся следующие данные. 

1. Параметры системы {К Г, ©, Е, @, р}, 
где К — число классов; С — число образов-эталонов в каждом 
классе; @ — общее число образов в классе, включая контрольные 

| образы; Е — число подобразов для каждого образа-эталона; @ — 
число матриц-градиентов; р — параметр метода РСА (см. разд. 5.1). 
2. Значения размеров всех используемых масок. 
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Рис. 6.4.3. Подобраз и три вычисленных для него градиента 


3. К исходных изображений, полученных непосредственно с 
видеокамер. 

4. К изображений лиц пользователей (образов-эталонов ЗЬ раз- 
мером 112х 96 пикселей), полученных из исходных изображений. 

5. Трехмерный массив размером 2х3хК, предназначенный 
для хранения значений координат Х и У, которые определяют 
точку пересечения оси симметрии лица и линии глаз на образах 
эталонах. 

6. Трехмерный массив размером 256 х (ГхЕ)ХК ‚ определяю- 
щий подобразы, перемасштабированные к размеру 16х 16 пиксе- 
лей и записанные векторами в результате выполнения операции 
конкатенации столбцов. 

7. Шесть двумерных массивов, определяющих матрицы редук- 
ции признаков по методу РСА (три матрицы имеют размеррх М 
и предназначены для редукции матриц-градиентов по столбцам, 
атри другие матрицы имеют размер Мхр и предназначены для 
редукции матриц-градиентов по строкам); 

8. Три двумерных массива, определяющих матрицы редукции 
признаков по методу ГЛА (матрицы имеют размер бхр°). 

9. Двумерный массив размером (3х (К - 1)) х(КхГхЕ), опре- 
деляющий признаки редуцированного пространства для всех К 
классов образов, трех образов (За, ЗЬ и Зе ) в каждом классе, Г, 
подобразов для каждого из образов За, ЗЬ и Зс и всех Е матриц 
градиентов. > 

10. Двумерный массив размером (3х (К — 1)) х К, определяющий 
«центры классов» — средние значения признаков в каждом классе. 
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На этапе синтеза системы распознавания (а конкретней, после 
выполнения редукции исходного пространства признаков) необ- 
ходимо проверить качество кластеризации признаков в редуци- 
рованном пространстве и, при необходимости, изменить некото- 
рые параметры системы для улучшения кластеризации [Гон78]. 

Оценить качество можно на основе некоторых формальных 

правил (например, можно оценить расстояния между центрами 
классов или величины средних отклонений образов в классах от 
их собственных центров). Однако можно использовать и визуаль- 
ный контроль: по характеру расположения центров классов мож- 
но судить о качестве выполненной кластеризации и, следователь- 
но, о потенциальной возможности собственно классификации об- 
разов в редуцированном пространстве признаков- 

На рис. 6.4.4 представлено ЗО-пространство признаков, полу- 
ченное в результате редукции для одной из матриц градиентов 
(в данном случае матрицы суммарного градиента яркости по оси 
Хи У). При этом параметры системы были следующими: К. 
Г=3, Е=9, р = 10. Это пространство представляет 1х3х9 = 189 
образов, каждый из которых описывается всего 6 признаками. 
Первые три из них определяют координаты Х, Уи 1 заданного 


3ЗО-пространства. 

В правой стороне рис- 6.4.4 обозначены все образы первого 
класса (также для матрицы суммарного градиента). Цифрой 1 
отмечен «центр класса» ‚ а каждый отдельный образ класса пред- 
ставлен точкой в ЗО, соединенной с центром класса. Эта линия 


показывает отклонение образа от центра класса. 
Аналогично можно было бы представить и следующие три при- 


знака редуцированного пространства, а также пространство при- 


знаков для других матриц градиентов. 








Рис. 6.4.4. Редуцированное пространство признаков, представленное в ЗО-форме, 
для системы © параметрами К = Т,Г.=3,Е=9,р=10 


213 















Результат, представленный на рис. 6.4.4, можно оценить к 
очень хороший. В противном случае, необходимо было бы 
брать другие параметры системы, и прежде всего параметр р, чт 
отмечалось в гл. 5. 

Представим теперь структуру рассматриваемой систем: 
(рис. 6.4.5). 

Меру подобия между образами-эталонами и каждым новым 
образом (или контрольными образами) будем определять двумя 
методами: либо базирующимся на взаимной корреляции, которая 
будет применяться в пространстве исходных образов, либо реали- 
зуемым на основе метрики 2, которая используется в редуциро- 
ванном пространстве признаков. О приоритетах этих методов ска- 
жем несколько позже. 


На структурной схеме системы цифрами 1 и2 обозначены по- 
сетитель системы КД и исходное изображение 


ных из исходного изображения образа лица, предназначенных для 
идентификации (в режиме тестирования системы это будут конт- 


для них буфере. Образ ЗЬ получен непосредственно из исходного 
изображения (без изменений его масштаба), а образы За и 3с на 


Цифрой 3' отмечены 3 подобраза (центральных относительно 


рамки), представленные (К -— 1)-м признаком в редуцированном 
пространстве (в данном случае 6 


ниваются с подобразами 4' всех классов 


системы. 

Цифрой 6 отмечены результаты в 
зателя подобия, основанного на метрике Г, например, расстояний в 
редуцированном пространстве признаков. Здесь можно использо- 
вать две стратегии: сравнение со всей совокупностью КТЕ под- 
образов 4' или сравнение с К средними подобразами, вычисленны- 
ми для совокупности 4'. В первом случае получаем по КГЕ оценок 


ычисления некоторого пока- 
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Рис. 6.4.5. Структура обсуждаемой системы 
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показателя подобия для каждого из образов 3'. За окончател: 
результат принимаются три оценки номера класса, Вторым ‹ 
ветствовали три минимальных расстояния из КГР оценок. Дал 
помощью мажоритарного принципа (два из трех) определяс 
номер класса, которому принадлежит распознаваемый образ. Е 

Во втором случае получаем по К оценок показателя подоби 
для каждого из образов 3'. За окончательный результат принима 
ется номер класса, которому соответствует минимум расстояни; 
из К оценок. 

Цифра 8 означает окончание процесса анализа результата клас- 
сификации нового образа и принятие окончательного решения, 
Далее идет отображение результата в случае успешной иденти- 
фикации посетителя (линия с цифрой 10), повторный запуск ви- 
деокамеры (линия с цифрой 7) в случае отрицательного результа- 
та распознавания и/или запись результата в протокол сеанса с 
посетителем (линия с цифрой 9). 

Положим, что в данной системе основым является метод клас- 
сификации, основанный на взаимной корреляции. Он достаточно 
хоронто себя проявил при испытаниях системы «Уз ог 1аепий са- 
Чоп». Очевидно, что от него не стоит отказываться, и его достаточно 
лишь несколько (несущественно) видоизменить применительно 
к конкретно рассматриваемой системе. 

Дополнительным методом, выполняющим функции верифи- 
кации, будет в таком случае метод классификации на основе мет- 
рики Г>. Верификацию будем применять в тех случаях, когда 
невозможно принятие решения об окончании идентификации на 
основе корреляционного метода. 

Если результаты классификации по основному алгоритму и 
верификации по дополнительному одинаковые, распознаваемый 
образ считается идентифицированным. 

В случаях, когда результаты классификации по основному ал- 
горитму и верификации по дополнительному являются разными, 
распознаваемый образ считается неидентифицированным. 

Рассмотрим теперь подробнее работу блока анализа резуль- 
татов классификации и принятия решений. 

Будем считать, что блоком «Определение мер 
зов на основе корреляции» вычислены коэффиц 
корреляции одного подобраза группы За, 
зами группы 4 (с каждым образом ив к 
совокупности полученных оценок корре 

максимальные значения. При этом для каждого из подобразов 
группы За, ЗЪ, 3с и сответствующих им подобразов 4 получаем 
одну оценку максимума корреляции Кр. Всего таким образом 
для каждого нового (контрольного) образа получим три оценки 
максимума корреляции: Кр(®, Кр()), Кр(®), где &, }, В — номера 
классов, которым принадлежат эти максимумы. 

Далее будем исходить из того, что оценки Кр(2, Кр()) и Кр(№) 
определяют принадлежность распознаваемого образа к одному 
классу только в том случае, если выполняется условие 















ы подобия обра- 
иенты взаимной 
ЗЬ, 3с со всеми подобра- 
аждом классе). Из всей 
ляции выбираем только 
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тах{Кр(о, Кр), Кр(®)} > Р: при! =]=В, (6.4.1) 


где Р\ — некоторый установленный порог. 
Будем также считать, что блоком «Определение меры подобия 
образов на основе метрики Т2» вычислены оценки расстояний 
между каждым образом группы 3' со всеми образами группы 4'. 
При этом для каждого образа группы 3' можем получить либо К 
оценок (если оценка выполняется относительно центров классов), 
либо КГЕ оценок (для К классов, Г, образов в каждом классе и Е 
подобразов для каждого образа). Из каждой совокупности полу- 
ченных оценок определяем номер класса так, как это было описа- 
но выше. По окончанию этой процедуры получим три оценки 
номеров классов: $, &, и, соответствующих подобразам а, В и с. 
Тогда, если выполняется условие {=#=0, то классификацию но- 
вого образа можно считать завершенной. 
Поскольку представленная процедура является дополнитель- 
ной, то окончательное принятие решения определяется при выпол- 
нении одного из условий: 


1=] ЕВЕЗЕЕ=Ь; (6.4.2) 
тах{ Кр, Кр), Кр(®) } > Р2 при (#+Е+0)/3=&; (6.4.3) 


любые пять индексов из {4 |, й, & &, 0} 
имееют одинаковое значение. (6.4.4) 


Рассмотрим еще одну стратегию проведения верификации. На- 
помним, что с каждого образа За (ЗЬ или 3с) можно получить по 9 
подобразов, входящих в группу 3'. Будем считать, что блоком «Оп- 
ределение меры подобия образов на основе метрики Т>» вычислены 
оценки расстояний между каждым подобразом группы 3" со всеми 
образами группы 4’. При этом для каждого образа группы 3’ мо- 
жем получить либо К оценок (если оценка выполняется относи- 
тельно центров классов), либо КГ.Е оценок (для К классов, Г, образов 
в каждом классе и Е подобразов для каждого образа). Из каждой 
совокупности полученных оценок выберем одну, соответствующую 
минимуму расстояния, и запомним номер М, класса, которому соот- 
ветствует этот минимум. Далее в специальном счетчике будет на- 
капливаться «1» так, что (№) = $(М№») + 1, где =1,2,..., К. Прини- 
мая во внимание нулевое начальное значение всех разрядов $(М,) 
счетчика перед началом процедуры оценки, сумма всех единичек в 
каждом счетчике будет равна величине Е (в нашем случае Р=9). 

По окончании этой процедуры рассматриваем четыре оценки: 
номер разряда каждого из трех счетчиков (суть — номер класса), 
который содержит максимальное число накопленных единичек, и 
сумму всех единичек, соответствующих трем максимумам. Тогда 
образ считается правильно распознанным, если выполняются два 
условия: 


= в=ои [9(№)) + $0\,)+ 50 )1> РЬ, (6.4.5). 
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где р, &, о — номера разрядов счетчиков (классов по ВБ), котор. 
содержат максимальное число накопленных единичек; Р. — к. 
который установленный порог. ы 

А теперь, заканчивая синтез системы, предъявим ей несколько 
образов с тем, чтобы оценить получаемые меры подобия. При этом 
сейчас нас интересуют только оценки на основе метрики Г», по. 
скольку оценки на основе корреляции можно использовать из 
системы «\15Цог еп сайоп». Из всех представленных выше 
стратегий классификации выберем последнюю, по которой можно 
получить довольно обширный статистический материал для оцен- 
ки меры подобия. 

На рис. 6.4.6 представлены образы для тестирования систе- 
мы. Первые пять образов принадлежат санкционированным 
пользователям системы. Напомним, что в ИБ рассматриваемой 
системы имеется только по одному образу санкционированного 
пользователя. Если говорить о лице этого пользователя, то оно 
представлено в ИБ строго в «фас» и не имеет никаких лишних 
предметов (например, шапок на голове). Предьявленные образы 
не отвечают этому требованию. Образ номер 6 вообще является 
рисунком, а оставшиеся четыре образа не представляют санкцио- 
нированных пользователей. 

Полученные результаты представлены в табл. 6.4.1. Здесь в левой 
части таблицы представлены характеристики образа, например, 1(+) 
означает, что оценка выполнена для образа № 1 из рис. 6.4.6 и что 
этот образ представляет санкционированного пользователя (+), 


а 6(-) означает, что оценка выполнена для образа № 6 из рис. 6.4.6 


и что этот образ не представляет санкционированного пользовате- 
ля (-). Строки, 


обозначенные буквами а, Ь и с, определяют оценки 
для соответствующих подобразов. Строка «а+Ъ + с» соответствует 



























































Результаты классификации тестовых образов 
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Таблица 6.4.1 








Продолжение таб 


Характеристика образа. 


Гы 
8 Го |: | 











суммарной оценке по трем образам. Собственно оценки представ- 
лены в правой части таблиц (для всех 7 разрядов счетчиков). 

Анализируя полученные оценки, можно отметить следующее: 

® если распознаваемый образ принадлежит к санкционирован- 
ному пользователю, то в счетчике заметен существенный макси- 
мум в соответствующем разряде, а число других «ненулевых» 
разрядов невелико, если не брать во внимание разряды, содержащие 
по одной единице; 

® номер класса, которому принадлежит распознаваемый образ, 
можно признать только тогда, когда число единичек в соответ- 
ствующем разряде больше величины Р/2 для подобразов и/или 
больше ЗЁ/2 для всех подобразов и при условии, что все максиму- 
мы принадлежат одному и тому же разряду счетчика. 

На основе представленных в табл. 6.4.1 данных с учетом условий 
(6.4.5) можно теперь определить порог Р.. Очевидно, что он не может 
м случае все первые пять образов из 
рис. 6.4.6 будут идентифицированы как образы, принадлежащие 5-му 
остальные образы остаются неиден- 


В заключение представим результат работы системы КД для 
двух случаев (показаны слева 


В первом случае новый обр 
ван на основе метода взаимной корреляции 


превысили порог 0,6, 
что и определило окончание процесса идентификации. 


Во втором случае максимумы корреляции были ниже порога 
0,6, но все они соответствовали одному и тому же классу. Выпол- 
ненная верификация на основе метрики [> также подтвердила 
тот же самый класс, что представлено записью в форме {5 55 /// 
555} под образом 2. При этом (в данном случае очевидно) сум- 
марное состояние счетчика составило [00002700], что опреде- 
лило 100 %-ную верификацию. 
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Рис. 6.4.7. Два варианта работы системы «Контроля доступа» 


В завершение дадим качественную оценку эффективности 
работы системы «Контроль доступа». Система проверялась в двух 
режимах: «оп-Йпе» и «оЁ#-Ппе». Во втором случае в качестве ис- 
ходных данных использовался тестовый набор, представленный 
на рис. 6.3.5, а также вся база данных [Ог!**]. На рис. 6.4.8а 
показаны образы, прошедитие идентификацию (в режиме «оп-ПНпе») 
как пользователи системы. На рис. 6.4.835 — ряд образов (из тес- 
товых образов рис. 6.3.5), не прошедших идентификацию, посколь- 
ку при их предъявлении система не относила их к образам заре- 
гистрированных пользователей. 

Образы базы [Ог!**] также не прошли идентификацию. Эти 
результаты свидетельствуют о высоком качестве идентификации 





























Рис. 6.4.8а. Результат тестирования системы «Контроля доступа»: образы, про- 
шедшие идентификацию и соответствующие им эталоны, хранящиеся в ВБ 
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Рис. 6.4.85. Результат тестирования системы «Контроля доступа»: образы, не про- 
шедшие идентификацию 


в системе КД и оее существенно больших возможностях по срав- 
нению с системой «\У1зЦог аеписаНоп». 


6.5. ИНТЕГРИРОВАННЫЕ СИСТЕМЫ 
РАСПОЗНАВАНИЯ 


Во всех рассмотренных выше системах распознавания исполь- 
зуются биометрические характеристики лица, полученные из его 
двумерного представления. Эти системы просты в эксплуатации, 
обладают высоким быстродействием и, как было показано выше, 
могут обеспечивать требуемые показатели качества распознава- 
ния (например, ЕАБВи ЕВБВ). Однако эти системы не защищены от 
несанкционированного доступа, поскольку могут быть обмануты 
плоскими изображениями лиц оригиналов (или фотомуляжей). 

Покажем это экспериментально: попробуем распознать фото- 
муляжи, которыми будут непосредственно служить рисунки 6.3.6 
и 6.4.3, «подставленные под камеру». Некоторые из этих фотому- 
ляжей представлены на рис. 6.5.1. 

Отметим две особенности этих образов — низкое качество (не- 
высокое разрешение, неконтрастность изображений, наличие зна- 
чительной шумовой составляющей, различие в освещении ит. д.) 
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Рис. 6.5.2. Результат тестирования систем распознавания «оп-Нпе»: образы, про- 
шедшие идентификацию (верхний ряд) и образы эталоны (нижний ряд) 


и зеркальное представление изображений лиц по отношению к 
лицам в базе данных (поскольку образом перед камерой являет- 
ся не лицо человека, а портрет лица). 

Следует сразу отметить, что не все из представленных выше 
образов удалось распознать (рис. 6.5.2). Лучшие результаты при 
этом показала система «Контроль доступа». При этом те образы, 
которые были распознаны, приходилось предъявлять системе по 
несколько раз подряд (выполняя несколько попыток). Возможно, 
причиной этого было низкое качество фотомуляжей, особенности 
способа их получения и нестационарные условия их предъявле- 
ния камере (лист с напечатанными образами держали в руках 
перед камерой), однако это также свидетельствует о некоторой 
защите тестируемых систем от обмана с помощью простых средств. 

Ограничение числа попыток распознавания предъявляемых 
системе образов — один из способов защиты от обмана. Однако 
представленный на рис. 6.5.2 результат, свидетельствует о необ- 
ходимости дополнительной защиты систем распознавания лиц 
от их обмана посредством примитивных фотомуляжей (зарегист- 
рированных пользователей). 

Один из вариантов защиты подобных систем состоит в их ин- 
тегрировании с системами идентификации (аутентификации), ис- 
пользующими другие биометрические характеристики человека. 
Ясно, чем больше используется дополнительных биометрических 
образов, тем труднее изготовить необходимые муляжи. Варианты 
построения подобных систем рассмотрены, например, в [Ноп98, 
2100]. ь 

В интегрированной системе [Ноп98] дополнительной характе- 
ристикой является отпечаток пальца, а в системе [Ег100] — голос 
и движения губ. Метод распознавания отпечатков пальцев, ис- 
пользуемый в [Ноп98], аналогичен методу, описанному в разд. 2.1. 
Особенности подхода [Ег100], использующего три биометрические 
характеристики, были проанализированы в разд. 2.3. 
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Рис. 6.5.3. Интегрированная биометрическая система 





Общая структура интегрированных биометрических систем иден- 
тификации (аутентификации) человека представлена на рис. 6.5.3. 

Обман таких систем становится практически невозможным 
из-за трудностей изготовления необходимых муляжей (имитато- 
ров звуков или движения губ, например). Привлекательны и та- 
кие их достоинства, как простота в эксплуатации, относительно 
низкая стоимость и высокое быстродействие. Это стало возмож- 
ным благодаря использованию в них в качестве основного ядра 
системы распознавания человека по лицу. 

Очевидно, что будущее систем идентификации личности чело- 
века связано с развитием именно интегрированных биометриче- 
ских систем. 





Тестовая база данных (ОБТ, РафаЪазе о# КГасез) 
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Ром Первые 10 классов образов базы данных 
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Продолжение: Классы 11 - 20 образов базы данных 
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Продолжение: Классы 21-30 образов базы данных 
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Продолжение: Классы 31 — 





40 образов базы данных 











СЛОВАРЬ ТЕРМИНОВ * 


Автоматический поиск области ли 


Реесйоп) — автоматическое определение координат подобраза на ис- 


ходном изображении, включающем собственно лицо, и выделение образа 
лица из исходного изображения. 


ца на изображениях (Расе 


Автоматический поиск элементов лица человека (Ашфошайс Рас1а1 
Кеафигез еесйоп) — автоматическое определение координат антропо- 
метрических точек лица таких, например, как уголки глаз, центры глаз, 


точка пересечения линии симметрии лица и линии глаз, кончик носа, 
уголки губ, центр губ ит.д. 


Автоматизированная система идентификации отпечатка пальца 
(АЕ) — специализированная биометрическая система, которая сравни- 


вает заданное изображение пальца с эталонами изображений пальца, за- 
писанными в базе данных. 


Актуальный эталон (Ве{егепсе Тетр!аёе) — данные, представляю- 
щие биометрические характеристики зарегистрированного пользователя 
биометрической системы. 


Анализ главных компонент (Ргшс!ра! сошропеп& апа!уз1з — РСА) — 
метод, позволяющий выявить основные изменчивости в обучающем на- 
боре исходных данных и описать эти изменчивости при помощи несколь- 
ких наибольших собственных чисел и соответствующих им собственных 
векторов; ортогональное преобразование, выполненное в базисе этих соб- 
ственных векторов (иначе преобразование Карунена—Лоэва или ПКЛ), 
позволяет трансформировать исходные признаки (представляющие на- 
бор исходных данных) в пространство признаков существенно меньшей 
размерности; этот процесс называется редукцией пространства призна- 
ков и именно в результате ПКЛ определяются главные компоненты. 

Анализ изображений (Ппаде Апа!уз!) — процесс выделения из изоб- 
ражения неизобразительной информации, а также описания/интерпрета- 
ции и представления изображения с помощью его компонентов, свойств и 
зависимостей. 

Анализ эмоций по выражению лица (Еас!а1 Ехргез510п5 Апа1у515) — 
определение типов выражения лица, которые можно интерпретировать 
как человеческие эмоции (например, страх, гнев, отвращение, грусть, удив- 
ление, счастье). 

Аутентификация (Ампепйсайот) — подтверждение идентичности 
представленного образа одноименному эталону, хранящемуся в памяти 
системы распознавания; аутентификация реаИЗУ ТЕ на основе провер- 
ки утверждения о том, что представленный образ есть именно тот, за ко- 
торый он себя «выдает». 

База данных, исходная база данных (РафаЪазе) — ыы 5 
ные или каталогизированные данные, представляющие тестовые о разы, 
предназначенные для проверки эффективности систем распознавания; 
структурированные или каталогизированные данные, опреде ое ион 
ходные образы санкционированных пользователей для каждой конкрет- 
ной системы распознавания. 

База данных минуций (Ми 
щая эталоные отпечатки пальце 
минуция определяется координатами 


1ае РафаЪазе) — база данных, содержа- 
в в форме вектора минуций. Каждая 
Х иу, углом ориентации папилляр- 
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ной линии в данной координате и дополнительно типом минуции 

пример, окончание или раздвоение линии). Каждый отпечаток па : 
, 

может быть представлен 50 — 70 минуциями. 


Банк паролей (Раззмог@ Вапк) — база данных, содержащая им 
пользователя, его пароль и другую персональную информацию о нем: зо. 
эти данные предназначены для того, чтобы допустить пользователя д 
системы и реализовать его идентификацию и/или верификацию. 

Биометрика (В1ошей:1с5) — область знаний, представляющая 
измерения физических характеристик (или персональных пове 
ких черт) человека и методы их сравнения с аналогичными дан 
базе данных для целей идентификации или аутентификации че 

Биометрическая система (Вошей1с бузфетз) — автомати 
ная система, способная реализовать функции: фиксации биомет 
выборки от конечного пользователя; извлечения биометрических данных 
из той выборки; сравнения биометрических данных с одним или большим 
количеством эталонов; принятия решения о том, как хорошо они соответст 
вуют; и индикации о том, была или нет достигнута идентификация или 
проверка идентичности. 


Биометрическая характеристика (В1отей1с Свагас+ег! 
римая физическая характеристика человека, 
его проверки на подлинность и 
пользователю. 










методы 
денчес- 
НЫМИ В 
ловека. 







зирован- 
рической 















5$Ие) — изме- 
используемая в процессе 
ли идентичность санкционированному 









Поведенческая биометрическая характе 
сфег1$Ие) — персональная поведенчес. 






Биометрические технолог 
и производства), представля: 







геометрия руки, 
голос, видео- и термо- 
днее время изображения ушей, отпе- 
иометрические харак- 
е компьютера, динами- 
походки. 






‚› подпись (а в после, 







теристики, например, 
ка написания рукописн 








распознавания с целью 
фикация реализуется а 


Виртуальная база данных (Уча! Баз 
жащая образы-эталоны в той форме, 
пользуются системой (программой 







аЪазе) — база данных, содер- 
В которой они непосредственно ис- 
› алгоритмом) распознавания. 








Время ответа/ Время обработки (Везропзе Типе/Ргосеззше Типе) — 
период, необходимый, чтобы биомет 


рическая система выработала реше- 
ние по идентификации или проверке б 


Время регистрации (ЕпгоЙтеп+ Тьп 
тить биометрическая система на получен: 
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е) — время, которое должна затра- 
ие биометрического образа (эталона) 















пользователя, включая фиксацию биометрической выборки от пользователя 
системы и извлечение биометрических данных (образа) из той выборки. 


Глобальные признаки отпечатка пальца (61оБа] Ешеегриий Реа4и- 


гез) — центры специфических участков отпечатк 
а (например, дельт у 
рали, петли ит. д.). (например, дельты, спи 


Зарегистрированный пользователь (ЕпгоПее) — человек, имеющий ак- 
туальный биометрический эталон в базе данных (или на файле) системы. 


Захват данных (Сарфиге) — метод получения биометрической инфор- 
мации (данных, выборки) от конечного пользователя. 


Идентификация биометрическая (В1ошейче 14епИЙсайоп) — процеду- 
ра, базирующаяся на технологии распознавания образов, и предназначенная 
для однозначного определения личности человека на основе его биометри- 
ческих характеристик при сравнении их с заданными эталонами. 


Идентификация образов (РаМегп 1Чепийсайоп) — процесс вынесе- 
ния решения об образе или собственно решение, которые приписывают 
этому образу однозначное название. 


Извлечение (Ехёгас#оп) — процесс преобразования биометрической вы- 
борки в биометрические данные и приведение их к некоторой стандартизо- 
ванной форме так, чтобы можно было их сравнивать с заданным эталоном. 


Изображение цифровое (О1&Ца1 Ппабе) — двумерное изображение, 
представленное в цифровой форме в виде числовой матрицы, каждый 
элемент которой может принимать 2Г значений яркости (обычно, 1<Г>8). 


Классификация образов (РаЦегп С аз Ясайоп) — процесс вынесе- 
ния решения об образе или собственно решение, которое указывает лишь 
на принадлежность образа к определенному классу образов. 

Кластеризация (Сазфег1хайопт) — процесс (или результат) группиро- 
вания исходных образов в совокупности — кластеры — на основе одина- 
ковых или близких значений некоторых признаков, присущих исход- 
ным образам. - ‚ 

Конечный пользователь (Еп4 Озег) — человек, который взаимодей- 
ствует с биометрической системой, чтобы зарегистрироваться или прове- 
рить идентичность. 

Конкатенация (Сопсафевайоп) — процесс (или результат) объедине- 
ния в одну последовательность отдельных подпоследовАчоНи О В зна- 
ков или символов, например, конкатенация строк или столоцов числовой 
матрицы в соответствующий вектор. В задачах распознавания двумерных 
образов, задаваемых соответствующими те к м 
рицы по строкам или столбцам переводит этот образ из двумерного пред- 
ставления в одномерное (векторное). й Ев 

Линейный дискриминантный анализ (Мпеаг пведекх — ь и РА = 
ТОРА) — процедура анализа и обработки ВОР т. верь мы: ее 
распознавания образов (в качест, р нес с же улучшения 
ки, характеризующие образы в отдельных Клее о нм в базисе 
их кластеризации. ГРА основан на линейно как г. решения задачи 
собственных функций, который получается в резу 


ы ковариации. Последняя, в свою 
на собственные значения для матриц; 
ных данных как 
очередь, представляет дисперсионную изменчивость исход; д 


образов. 
внутри классов образов, так и между о. } а биометрическая си- 
Ложный отказ (Еа15е Вефесйоп) — случай, од ть г ее: 
стема не подтверждает истинность зарегистриров м 
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Минуции (Мши@ае) — точки, соответствующие разрывам, ох. 
ям и раздвоениям бороздок папиллярных линий на образах отпь. 
пальца; минуции определяют локальные признаки отпечатка паз... 
описаны в эталоне отпечатка. 


Модуль идентификации отпечатка пальца (Етеегргт+ 1ЧепЫйсацот 
Оп — Е) — биометрическая система, способная к получению, сохра. 
нению и сравнению данных отпечатков пальцев для проверки иденти :. 
ности индивидуума. 


Непосредственное чтение отпечатка пальца (РЕК) — устройство, 
предназначенное для непосредственного сканирования изображения п 
ца из пальца индивидуума. 


Один из многих (Опе-10-Мапу) — поиск по заданному образу подоб. 
ных образов в базе данных с тем, чтобы определить существует или нет 
кандидат в базе данных (синоним идентификации). 


Один из одного (Опе-ю-Опе) — установление идентичности заданно- 
го образа некоторому образу-эталону (синоним верификации). 


Персональный номер идентификации (Регзопа! Т4епи сан оп 
МишБег — РИМ) — номер с четырьмя цифрами, вводимый пользователем 
в систему но ее запросу, и используемый как код доступа к специфичес- 
кой области системы; использование РИМ определяет один из методов за- 
щиты доступа к системе. 

Пиксель (Р1сфиге се, рахе! 
ражения, который характери 
яркости. 





аль- 


) — наименьший элемент цифрового изоб- 
зуется собственным значением (уровнем) 


Порог (ТЬгезво!а) — предельно 
раметра, определяющее 
ре верификации. 


е значение некоторого заданного па- 
условие принятия решения, например, в процеду- 


Признак (Ееафиге) — компоненты 


объект, текстура), атрибуты образа (например, его размер, форма) или ха- 
рактеристики образа (например, яркость, спектр), используемые в распозна- 
вании образов; в общем случае признак определяется той категорией, по- 
средством которой он выражен; известны и используются три категории 
признаков физические, етрувтура не ина матичавкие. 

Программа технологии распознавания лиц (Расе Кесои1Ноп 
Тесвпо]ову/ЕЕВЕТ) — комплексная разработка (агентства РАКРА и ис- 
следовательской лаборатории армии США), предназначенная для оценки 
эффективности предлагаемых алгоритмов распознавания лиц и стиму- 
лирования развития наилучших из них. 


Распознавание лиц (Еасе Кесой оп) — раздел биометрики, пред- 
ставляющий методы и средства решения задач распознавания и наблю- 
дения человека (идентификацию или классификацию) по изображени- 


образа (например, выделенный 
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НОСТИ ЗаДанно. 
ЦИИ), 
[еп са ол 
пользователем 
к специфичес- 
из методов 3а- 


ового изб: 


ИО 
у фр овнем) 


ием (ур 








ям его лица, а также интерпретации действий человека — его намерений 


и поведения — через идентификацию его эмоционального состояния и 
окружающих его людей. 


Распознавание образов (РаЙеги Кесобш оп) — процесс, складываю- 
щийся из двух частей: 1 — определения и извлечения признаков; 2 — 
принятия решения о принадлежности предъявленного образа (представ- 
ленного в виде совокупности признаков) к одному из известных классов 
(при че решается либо задача идентификации, либо задача классифи- 
кации). 


Регистрация пользователя (Епго]теп{) — процесс сбора биометри- 
ческих данных от пользователя, включающий в себя: фиксацию биомет- 
рической выборки от пользователя системы, извлечение биометрических 
данных (образа) из той выборки, сохранение текущих (актуальных) био- 
метрических данных; в результате регистрации получаются исходные 
биометрические данные (исходный образ/образы), представляющие кон- 
кретного индивидуума. 


Собственные лица (Е1хеп Еасез) — элементарный образ лица, рекон- 
струированный на основе главных компонент и обратного преобразова- 
ния Карунена—Лоэва. 


Сопоставление с эталоном (Тешр!аёе МафсВт&) — процессе сравне- 
ния биометрической выборки с эталоном и оценка уровня подобия меж- 
ду ними. 


Сравнение (Сотраг!з0п) — процесс сравнения биометрических дан- 
ных конкретного человека с заданным эталоном на основе некоторой 
метрики. 


Станция регистрации (ЕпгоШиеп& З{айоп) — автоматизированное 
рабочее место, в котором биометрика индивидуума (отпечаток пальца, го- 
лос, изображение лица ит. д.) и его персональная информация (имя, адрес, 
ит. д.) могут быть введены в систему биометрической идентификации. 

Уровень ошибочных отказов (Еа15е Ведесё Вафе — ЕВЕ) — вероят- 
ность того, что биометрическая система не идентифицирует зарегистри- 
рованного пользователя или не подтверждает его подлинности. 

Уровень ошибочных подтверждений (Еа]зе Ассерапсе Ве — 
ЕАК) — вероятность того, что биометрическая система ошибочно иденти- 
фицирует несанкционированного (незарегистрированного) пользователя 
и/или подтверждает его подлинность. 

Цифровая подпись (О1На! З1епафиге) — образ подписи, представ- 
ленный в цифровой зашифрованной форме, не позволяющей чтение/ин- 
терпретацию подписи без использования соответствующего дешифриру- 
ющего ключа. 

Шифрование (Епсгурйоп) — преобразование открытого текста в прак- 
Тически не читаемую форму с использованием математического преобра- 
зования. } 

Эталон отпечатка пальца (Ешеегрги Тешр]а{е) — описание всех 
обнаруженных минуций (деталей) в образе отпечатка пальца; эталон со- 
держит координаты Х и У каждой из минуции, ее тип и наклон, которые 
характеризуют конкретный отпечаток пальца и используются для срав- 
Нения с отпечатками пальцев всех прочих кандидатов. 


—-— 
* — Подготовлен на основе В1отейс СЛоззагу [В1о**]. 
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